Linux за българи: Форуми

Хардуер за Линукс => Сървъри => Темата е започната от: teleport в Feb 08, 2009, 11:38



Титла: Тест на 1 ядро на Core2Quad
Публикувано от: teleport в Feb 08, 2009, 11:38
След няколко месеца работа машината почна да гърми със странен проблем.

Код:
messages.2-Jan 21 18:20:23 localhost kernel: invalid opcode: 0000 [#1]
messages.2-Jan 21 18:20:23 localhost kernel: SMP
messages.2-Jan 21 18:20:23 localhost kernel: CPU:    3
messages.2-Jan 21 18:20:23 localhost kernel: EIP:    0060:[<c04e5e88>]    Not tainted VLI
messages.2-Jan 21 18:20:23 localhost kernel: EFLAGS: 00210046   (2.6.18-53.el5 #1)
messages.2-Jan 21 18:20:23 localhost kernel: EIP is at list_del+0x38/0x5c
--
messages.2-Jan 23 10:01:57 localhost kernel: invalid opcode: 0000 [#1]
messages.2-Jan 23 10:01:57 localhost kernel: SMP
messages.2-Jan 23 10:01:57 localhost kernel: CPU:    3
messages.2-Jan 23 10:01:57 localhost kernel: EIP:    0060:[<c04e5e88>]    Not tainted VLI
messages.2-Jan 23 10:01:57 localhost kernel: EFLAGS: 00210046   (2.6.18-53.el5 #1)
messages.2-Jan 23 10:01:57 localhost kernel: EIP is at list_del+0x38/0x5c
--
messages.2-Jan 24 16:26:20 localhost kernel: invalid opcode: 0000 [#1]
messages.2-Jan 24 16:26:20 localhost kernel: SMP
messages.2-Jan 24 16:26:21 localhost kernel: CPU:    3
messages.2-Jan 24 16:26:21 localhost kernel: EIP:    0060:[<c04e5e88>]    Not tainted VLI
messages.2-Jan 24 16:26:21 localhost kernel: EFLAGS: 00210046   (2.6.18-53.el5 #1)
messages.2-Jan 24 16:26:21 localhost kernel: EIP is at list_del+0x38/0x5c
--
messages.2-Jan 25 23:00:06 localhost kernel: invalid opcode: 0000 [#1]
messages.2-Jan 25 23:00:06 localhost kernel: SMP
messages.2-Jan 25 23:00:06 localhost kernel: CPU:    3
messages.2-Jan 25 23:00:06 localhost kernel: EIP:    0060:[<c04e5e88>]    Not tainted VLI
messages.2-Jan 25 23:00:06 localhost kernel: EFLAGS: 00210046   (2.6.18-53.el5 #1)
messages.2-Jan 25 23:00:06 localhost kernel: EIP is at list_del+0x38/0x5c
--
messages.1-Jan 27 14:41:44 localhost kernel: invalid opcode: 0000 [#1]
messages.1-Jan 27 14:41:44 localhost kernel: SMP
messages.1-Jan 27 14:41:44 localhost kernel: CPU:    3
messages.1-Jan 27 14:41:44 localhost kernel: EIP:    0060:[<c04e5e88>]    Not tainted VLI
messages.1-Jan 27 14:41:44 localhost kernel: EFLAGS: 00210046   (2.6.18-53.el5 #1)
messages.1-Jan 27 14:41:44 localhost kernel: EIP is at list_del+0x38/0x5c

Имам още 30-тина хардуерно аналогични машини работещи със същия image на операционната систена които нямат подобни проблеми.
Смяната на паметта не помага.
Преместването на харда на друга машина премахва проблема.

Проблема в никакъв случай не е софтуерен. Със това ядро работят всичките машини от над 1 година и определно това е първия проблем, който се появява. Проблемната машина е в добре климатизирано помещение и е зад ups-и с двойна конверсия. Заедно с нея има още 7 при които няма проблем. Останалите са на значително по-топли места.

Прави впечатление че грешката винаги е в 4-тото ядро.
Memtest86 върви вече една седмица без да открие проблем.

Въпросите:

1. На някой да му е дефектирал Q6600?
2. Има ли програмка с която може да се тества конкретно ядро? Няма значение OS-a, стига резултата да е достатъчно достоверен за да ми уважат гаранцията и да сменят процесора.


Титла: Re: Тест на 1 ядро на Core2Quad
Публикувано от: tyuio в Feb 08, 2009, 11:57
http://users.bigpond.net.au/CPUburn/
http://www.techbriefs.com/component/content/article/1544
http://www.gigascale.org/pubs/24.html
http://www.7byte.com/
Първата съм я пробвал но не се оправих, само разбрах че котлона на amd грее :)
Общо взето е доста вероятно да е или процесора или дъното наистина.


Титла: Re: Тест на 1 ядро на Core2Quad
Публикувано от: LinuxFanUNIX в Feb 10, 2009, 14:46
Ако е от процесора - пробвай с поставянето на LiveDisc на някой Live диструбиция и виж дали пък ти дава така...

А BIOS-а да дава някакви странични надписи, които преди не са се появявали...?


Титла: Re: Тест на 1 ядро на Core2Quad
Публикувано от: sandman_7920 в Feb 12, 2009, 13:15
http://weather.ou.edu/~apw/projects/stress/
Не може само на едно ядро но може на всички едновременно + може и памет malloc()/free() тест с N bytes и още доста неща. Също може да направиш тест и със superPI


Титла: Re: Тест на 1 ядро на Core2Quad
Публикувано от: space_rider в May 01, 2009, 21:33
По-добре късно от колкото никога :) . Можеш да си изключиш всички други ядра и да си пуснеш тестовете. Дадено ядро можеш да изключиш така
 echo "0" > /sys/devices/system/cpu/cpu1/online

Друг вариант е просто да си настроиш cpu affinity на тестовия процес, така че той да работи само на определено/и ядро/ядра