След няколко месеца работа машината почна да гърми със странен проблем.
messages.2-Jan 21 18:20:23 localhost kernel: invalid opcode: 0000 [#1]
messages.2-Jan 21 18:20:23 localhost kernel: SMP
messages.2-Jan 21 18:20:23 localhost kernel: CPU: 3
messages.2-Jan 21 18:20:23 localhost kernel: EIP: 0060:[<c04e5e88>] Not tainted VLI
messages.2-Jan 21 18:20:23 localhost kernel: EFLAGS: 00210046 (2.6.18-53.el5 #1)
messages.2-Jan 21 18:20:23 localhost kernel: EIP is at list_del+0x38/0x5c
--
messages.2-Jan 23 10:01:57 localhost kernel: invalid opcode: 0000 [#1]
messages.2-Jan 23 10:01:57 localhost kernel: SMP
messages.2-Jan 23 10:01:57 localhost kernel: CPU: 3
messages.2-Jan 23 10:01:57 localhost kernel: EIP: 0060:[<c04e5e88>] Not tainted VLI
messages.2-Jan 23 10:01:57 localhost kernel: EFLAGS: 00210046 (2.6.18-53.el5 #1)
messages.2-Jan 23 10:01:57 localhost kernel: EIP is at list_del+0x38/0x5c
--
messages.2-Jan 24 16:26:20 localhost kernel: invalid opcode: 0000 [#1]
messages.2-Jan 24 16:26:20 localhost kernel: SMP
messages.2-Jan 24 16:26:21 localhost kernel: CPU: 3
messages.2-Jan 24 16:26:21 localhost kernel: EIP: 0060:[<c04e5e88>] Not tainted VLI
messages.2-Jan 24 16:26:21 localhost kernel: EFLAGS: 00210046 (2.6.18-53.el5 #1)
messages.2-Jan 24 16:26:21 localhost kernel: EIP is at list_del+0x38/0x5c
--
messages.2-Jan 25 23:00:06 localhost kernel: invalid opcode: 0000 [#1]
messages.2-Jan 25 23:00:06 localhost kernel: SMP
messages.2-Jan 25 23:00:06 localhost kernel: CPU: 3
messages.2-Jan 25 23:00:06 localhost kernel: EIP: 0060:[<c04e5e88>] Not tainted VLI
messages.2-Jan 25 23:00:06 localhost kernel: EFLAGS: 00210046 (2.6.18-53.el5 #1)
messages.2-Jan 25 23:00:06 localhost kernel: EIP is at list_del+0x38/0x5c
--
messages.1-Jan 27 14:41:44 localhost kernel: invalid opcode: 0000 [#1]
messages.1-Jan 27 14:41:44 localhost kernel: SMP
messages.1-Jan 27 14:41:44 localhost kernel: CPU: 3
messages.1-Jan 27 14:41:44 localhost kernel: EIP: 0060:[<c04e5e88>] Not tainted VLI
messages.1-Jan 27 14:41:44 localhost kernel: EFLAGS: 00210046 (2.6.18-53.el5 #1)
messages.1-Jan 27 14:41:44 localhost kernel: EIP is at list_del+0x38/0x5c
Имам още 30-тина хардуерно аналогични машини работещи със същия image на операционната систена които нямат подобни проблеми.
Смяната на паметта не помага.
Преместването на харда на друга машина премахва проблема.
Проблема в никакъв случай не е софтуерен. Със това ядро работят всичките машини от над 1 година и определно това е първия проблем, който се появява. Проблемната машина е в добре климатизирано помещение и е зад ups-и с двойна конверсия. Заедно с нея има още 7 при които няма проблем. Останалите са на значително по-топли места.
Прави впечатление че грешката винаги е в 4-тото ядро.
Memtest86 върви вече една седмица без да открие проблем.
Въпросите:
1. На някой да му е дефектирал Q6600?
2. Има ли програмка с която може да се тества конкретно ядро? Няма значение OS-a, стига резултата да е достатъчно достоверен за да ми уважат гаранцията и да сменят процесора.