Автор Тема: Ubuntu server 9.04 CRASH (GA-MA770-UD3 rev2.0 & Phenom II X4 940) [SOLVED]  (Прочетена 3534 пъти)

SoundreameR

  • Участници
  • ***
  • Публикации: 8
  • Distribution: openSUSE/Ubuntu Server/Slackware
  • Window Manager: KDE/LXDE
    • Профил
Здравейте хора, от около 2 месеца имам нов сървър, реших да му сложа ubuntu server 9.04, кернела по настоящем е 2.6.28.11. Обаче след първия месец ъптайм започна да блокира без причинно. Машината работи, отваря connections, но не response-ва по никой service. Нито SSH, нито FTP, WWW. След 2-3 забивания, през интервал 2-3-4 дена, накрая оставих един монитор вързан за машината и когато заби пак видях на екрана, че през около минута се изсипват тонове лог, от които накрая на екрана остава само нещо подобно на следното (което снимах и после преписах)
Код:
[523423.373753] [<ffffffff802e84f0>] sys_writev+0x50/0x10
[523423.373753] [<ffffffff8021253e>] system_ceil_fastpath+0x16/0x1b
[523423.373753] BUG: soft lookup - CPU#3 stuck for 61s! [libvirtd:2585]
[523423.373753] Modules linked in: i2c_dev ipt_MASQUERADE iptable_nat nf_nat nf_conntrack_ipv4 nf_defrag_ipv4 xt_state nf_conntrack ipt_REJECT xt_tcpudp iptable_filter iptables x_tables bridge stp
kvm_amd kvm video_output input_polldev lp snd_hda_intel snd_pcm snd_timer snd ppdev soundcore pcspkr iZc_piix4 snd_page_alloc parport_pc parport r8169 mii floppy vesafb fbcon tileblit
softcursor
[523423.373753] CPU 3:
[523423.373753] Modules linked in: i2c_dev ipt_MASQUERADE iptable_nat nf_nat nf_conntrack_ipv4 nf_defrag_ipv4 xt_state nf_conntrack ipt_REJECT xt_tcpudp iptable_filter iptables x_tables bridge stp
kvm_amd kvm video_output input_polldev lp snd_hda_intel snd_pcm snd_timer snd ppdev soundcore pcspkr iZc_piix4 snd_page_alloc parport_pc parport r8169 mii floppy vesafb fbcon tileblit
softcursor
[523423.373753] Pid: 2585, comm: libvirtd Tained: G D 2.6.28.11-server #42-Ubuntu
[523423.373753] RIP: 0010:[<ffffffff8022f566>] [<ffffffff8022f566>] __ticket_spin_lock+0x16/0x20
[523423.373753] RSP: 0018:ffff88012d823e78 EFLAGS: 00000293
[523423.373753] RAX: 0000000000001917 RBX: ffff88012d823e78 RCX: 0000000000136da9
[523423.373753] RDX: 0000000000002710 RSI: 0000000000000001 RDI: ffffffff809b4b00
[523423.373753] RBP: ffff88012d823e78 R08: 0000000000000000 R09: 0000000000000000
[523423.373753] R10: 00007fffc018bc00 R11: 0000000000000202 R12: 0000000000000000
[523423.373753] R13: ffff88012ee78600 R14: ffff88012c616680 R15: ffff88012d823dd8
[523423.373753] FS:  00007f75b817e790(0000) GS: ffff88012f802f80(0000) KnIGS: 00000000f7d836c0
[523423.373753] CS:  0010 DS: 0000 ES: 0000 CRO: 000000008005003b
[523423.373753] CR2: 00007f242b85b4b8 CR3: 00000001269ab000 CR4: 00000000000006a0
[523423.373753] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
[523423.373753] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
[523423.373753] Call Trace:
[523423.373753] [<ffffffff8069dd49>] _spfn_lock+0x9/0x10
[523423.373753] [<ffffffff80416b10>] _atomic_dec_and_lock+0x60/0x90
[523423.373753] [<ffffffff802f9b20>] dput+0x60/0x90
[523423.373753] [<ffffffff802e8db0>] __fput+0x150/0x1e0
[523423.373753] [<ffffffff802e8e5d>] fput+0x1d/0x30
[523423.373753] [<ffffffff802e52fb>] flip_close+0x5b/0x90
[523423.373753] [<ffffffff802e53ea>] sys_close+0xba/0x120
[523423.373753] [<ffffffff8021253a>] system_call_fastpath+0x16/0x1b

Нито клавиатурата нито нищо не е адекватно в този момент. Само дъмпва на екрана... след reboot всичко е като по мед и масло... следващите 3-4 дена. Ето малко и за хардуера:
Код:
cat /proc/cpuinfo

processor       : 0
vendor_id       : AuthenticAMD
cpu family      : 16
model           : 4
model name      : AMD Phenom(tm) II X4 940 Processor
stepping        : 2
cpu MHz         : 800.000
cache size      : 512 KB
physical id     : 0
siblings        : 4
core id         : 0
cpu cores       : 4
apicid          : 0
initial apicid  : 0
fpu             : yes
fpu_exception   : yes
cpuid level     : 5
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dn$
bogomips        : 6026.45
TLB size        : 1024 4K pages
clflush size    : 64
cache_alignment : 64
address sizes   : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate

processor       : 1
vendor_id       : AuthenticAMD
cpu family      : 16
model           : 4
model name      : AMD Phenom(tm) II X4 940 Processor
stepping        : 2
cpu MHz         : 800.000
cache size      : 512 KB
physical id     : 0
siblings        : 4
core id         : 1
cpu cores       : 4
apicid          : 1
initial apicid  : 1
fpu             : yes
fpu_exception   : yes
cpuid level     : 5
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dn$
bogomips        : 6027.26
TLB size        : 1024 4K pages
bogomips        : 6027.26
TLB size        : 1024 4K pages
clflush size    : 64
cache_alignment : 64
address sizes   : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate

processor       : 2
vendor_id       : AuthenticAMD
cpu family      : 16
model           : 4
model name      : AMD Phenom(tm) II X4 940 Processor
stepping        : 2
cpu MHz         : 800.000
cache size      : 512 KB
physical id     : 0
siblings        : 4
core id         : 3
cpu cores       : 4
apicid          : 2
initial apicid  : 3
fpu             : yes
fpu_exception   : yes
cpuid level     : 5
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dn$
bogomips        : 6027.21
TLB size        : 1024 4K pages
clflush size    : 64
cache_alignment : 64
address sizes   : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate

processor       : 3
vendor_id       : AuthenticAMD
cpu family      : 16
model           : 4
model name      : AMD Phenom(tm) II X4 940 Processor
stepping        : 2
cpu MHz         : 800.000
cache size      : 512 KB
physical id     : 0
siblings        : 4
core id         : 2
cpu cores       : 4
apicid          : 3
initial apicid  : 2
apicid          : 3
initial apicid  : 2
fpu             : yes
fpu_exception   : yes
cpuid level     : 5
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dn$
bogomips        : 6027.30
TLB size        : 1024 4K pages
clflush size    : 64
cache_alignment : 64
address sizes   : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate

linuxinfo
Linux darkstar 2.6.28-11-server #42-Ubuntu SMP Fri Apr 17 02:45:36 UTC 2009
Four AMD Unknown 800MHz processors, 24108.22 total bogomips, 3899M RAM
System library 2.9.0

 free
             total       used       free     shared    buffers     cached
Mem:       3992976    1328992    2663984          0     177744     925784
-/+ buffers/cache:     225464    3767512
Swap:      7815612          0    7815612

df
Filesystem           1K-blocks      Used Available Use% Mounted on
/dev/sda1             11535344   1766684   9182692  17% /
tmpfs                  1996488         0   1996488   0% /lib/init/rw
varrun                 1996488      1096   1995392   1% /var/run
varlock                1996488         0   1996488   0% /var/lock
udev                   1996488       140   1996348   1% /dev
tmpfs                  1996488         0   1996488   0% /dev/shm
lrm                    1996488      2760   1993728   1% /lib/modules/2.6.28-11-server/volatile
/dev/sda6            134630312   6445212 121346232   6% /bkp
/dev/sda3             19228308    467012  17784544   3% /home
/dev/sda5            134574084    962320 126775708   1% /srv


Ако е нужно още инфо веднага ще предоставя. Моля ви се, дайте ми някакъв съвет.. от какво може да е? Ако е хардуер, какво точно, за да знам какво да нося в сервиза за подмяна..  ;D
« Последна редакция: Dec 11, 2009, 14:06 от SoundreameR »
Активен

arda_kj

  • Напреднали
  • *****
  • Публикации: 631
  • Distribution: Debian Sid/Unstable; Ubuntu 12.04
  • Window Manager: Gnome/KDE
    • Профил
Re: Ubuntu server 9.04 kernel 2.6.28.11 CRASH
« Отговор #1 -: Oct 03, 2009, 02:06 »
Дай някво инфо от логовете във /var/log след краша, например
cat /var/log/syslog
cat /var/log/messages
cat /var/log/kern.log


Други идеи:
1) Пробвай с LiveCD, остави го четири дена да си бъцка по компа и виж дали ще забие. Ако не забие значи проблема е в инсталираното Убунту или хард диска. Ако забие значи проблема много вероятно е хардуерен - памет, дъно, процесор и т.н.
2) Направи тест на RAM паметта с memtest, да не би да идва от нея проблема.
3) Тест на харда (използвй smrtctl или hdparm)- да не би да идва от него. По нататъшен тест с харда - инсталираш smartmontools пакета и с smartctl --all /dev/sda си проверяваш диска по инфото, което ще ти избълва дали ти е наред и т.н.
4) Ъпгрейдната ли е ситемата с най-последните ъпдейти на Убунту?
5) Остави текущото Убунту да бачка в някакъв друг runlevel, например в single user level, т.е. runlevel 1. Идеята е да се спрат всички ненужни услуги и да се види дали не идва проблема от някоя от тях.
« Последна редакция: Oct 03, 2009, 04:10 от arda_kj »
Активен

Debian Sid/Unstable; Ubuntu 12.04
"За да открием истината, е нужно поне веднъж в живота си да подложим всичко на съмнение" - Р. Декарт

SoundreameR

  • Участници
  • ***
  • Публикации: 8
  • Distribution: openSUSE/Ubuntu Server/Slackware
  • Window Manager: KDE/LXDE
    • Профил
Re: Ubuntu server 9.04 kernel 2.6.28.11 CRASH
« Отговор #2 -: Oct 03, 2009, 12:28 »
Здравей, благодаря за бързия отговор. Нарочно не публикувах логовете, защото в тях няма абсолютно нищо интересно.. единствено boot нещата, за момента на "срив" явно не успява да напише нищо по харда. Засега ще отложа точка 1, точка 2 ще я пробвам и ще напиша резултатите. Точка 3 ми беше първата идея когато се появи проблема - без резултат. Снощи ъпгрейднах системата, махнах няколко съмнителни пакета, спрях някои ненужни сървизи, ядрото се обнови до 2.6.28.15 и сега пак чакам... Точка 5 също като 1 засега ще я отложим. Пакета който махнах беше именно libvirt-bin, защото гледам, че с него е зависнало 4-тото ядро. Ще изчакам да видя дали има ефект.  :P
Активен

peterangelov

  • Напреднали
  • *****
  • Публикации: 41
    • Профил
Re: Ubuntu server 9.04 kernel 2.6.28.11 CRASH
« Отговор #3 -: Oct 04, 2009, 00:26 »
лека идея, ако имаш irqbalance пуснат, пробвай да го изключиш
 [_]3
Активен

SoundreameR

  • Участници
  • ***
  • Публикации: 8
  • Distribution: openSUSE/Ubuntu Server/Slackware
  • Window Manager: KDE/LXDE
    • Профил
Re: Ubuntu server 9.04 kernel 2.6.28.11 CRASH
« Отговор #4 -: Oct 04, 2009, 16:06 »
лека идея, ако имаш irqbalance пуснат, пробвай да го изключиш
 [_]3
Ми май нямам такова нещо пуснато.  :)


2) Направи тест на RAM паметта с memtest, да не би да идва от нея проблема.

Минаха 7 цикъла с 2000 mb от паметта, всичко "ОК"
Активен

SoundreameR

  • Участници
  • ***
  • Публикации: 8
  • Distribution: openSUSE/Ubuntu Server/Slackware
  • Window Manager: KDE/LXDE
    • Профил
Re: Ubuntu server 9.04 kernel 2.6.28.11 CRASH
« Отговор #5 -: Oct 25, 2009, 13:57 »
Добрее.. тъй като проблема продължава. Според вас има ли вероятност да е от биос-а. На места из нета четох, че това дъно с тези процесори понякога има подобни проблеми и решението е флашване. Дъното е GA-MA770-UD3 rev 2.0 (не 1.0, различни дъна са) С най-стария си биос FA, в момента има вече FF. Ако има надежда ще намеря някво флопи да го флашна.  ^-^

П.С.: В опътването на дъното четох за позиционирането на рама. Аз го бях сложил на 1-ви и 3-ти слот (те са 4), а там пишеше ако са само 2 рейки, БИЛО ПРЕПОРЪЧИТЕЛНО да се сложат на 1 и 2. Дали само заради Dual channel-а или .. ддз..  ???
« Последна редакция: Oct 25, 2009, 13:59 от SoundreameR »
Активен

SoundreameR

  • Участници
  • ***
  • Публикации: 8
  • Distribution: openSUSE/Ubuntu Server/Slackware
  • Window Manager: KDE/LXDE
    • Профил
Re: Ubuntu server 9.04 kernel 2.6.28.11 CRASH
« Отговор #6 -: Dec 11, 2009, 13:54 »
Проблема е решен! Братлета, за всеки който си купи дъно GA-MA770-UD3 (rev 2.0) или (rev 1.0) с този процесор AMD Phenom(tm) II X4 940 Processor, задължително трябва да флашнете биоса до версия F9 при rev 1.0 и до FF при rev 2.0!!! Проблема се състои в това, че този процесор има критични изисквания към волтажа на ядрото! Ако падне дори и за миг под 1.25V процесора забива. Във флаша на биоса фиксват този проблем и го карат да държи винаги по-високи нива на волтажа. Вече 3 седмици uptime след флашването!  [_]3 Върви като звяр!  ;D
Активен

laskov

  • Напреднали
  • *****
  • Публикации: 3166
    • Профил
Спрямо GigaByte моята стратегия е "Не купувам и не препоръчвам".
Активен

Не си мислете, че понеже Вие мислите правилно, всички мислят като Вас! Затова, когато има избори, идете и гласувайте, за да не сте изненадани после от резултата, и за да не твърди всяка партия, че тя е спечелила, а Б.Б. (С.С., ...) е загубил, а трети да управлява.  Наздраве!  [_]3

nemanema

  • Напреднали
  • *****
  • Публикации: 103
    • Профил
Здрасти !
За мен е интересно друго. Понеже съм пропуснал началото на темата и сега прочетох решението.
Предварително заявявам, че съм пристрастен към АМД (препоръчвам на всички фенове да видят на сайта новината за плащането на 1,25 млрд. ).
Не искам да коментирам финанси, но с десктоп дъно може ли да се прави "сървър"? И кой е "умника" дето е продал нефлашнато дъно на човека (да го знаем и да не се набутваме да купуваме от него) ?
Другото интересно: ако към момента на продажбата не е имало флаш за проблема, защо не е върнато обаждане с препоръка ?
Добре, че човека е ровил и намерил решение за себе се ! По-готиния момент, е че го споделя, похвално !
Активен

---=== мир и любов ===---