Linux за българи: Форуми

Linux секция за напреднали => Хардуерни и софтуерни проблеми => Темата е започната от: tmcdos в Dec 21, 2010, 11:56



Титла: Неочаквани REBOOT-и
Публикувано от: tmcdos в Dec 21, 2010, 11:56
Имам сървър с Fedora 6, който се използва близо 5 години вече. Преди около месец сложих нова памет - 4 по 2ГБ.
От тогава досега 2 пъти се рестартира самичък - през около 10 дни. В /var/log/messages не пише нищо:
Код:
Dec 21 05:33:12 crm smartd[2703]: Device: /dev/hda, 2 Currently unreadable (pending) sectors 
Dec 21 05:33:12 crm smartd[2703]: Device: /dev/hda, 2 Offline uncorrectable sectors
Dec 21 08:01:06 crm syslogd 1.4.1: restart.
Dec 21 08:01:06 crm kernel: klogd 1.4.1, log source = /proc/kmsg started.
Dec 21 08:01:06 crm kernel: OS-provided physical RAM map:
Dec 21 08:01:06 crm kernel:  BIOS-e820: 0000000000000000 - 000000000009fc00 (usable)
Dec 21 08:01:06 crm kernel:  BIOS-e820: 000000000009fc00 - 00000000000a0000 (reserved)
Dec 21 08:01:06 crm kernel:  BIOS-e820: 00000000000e5000 - 0000000000100000 (reserved)
Dec 21 08:01:06 crm kernel:  BIOS-e820: 0000000000100000 - 00000000bff80000 (usable)
Dec 21 08:01:06 crm kernel:  BIOS-e820: 00000000bff80000 - 00000000bff8e000 (ACPI data)
Dec 21 08:01:06 crm kernel:  BIOS-e820: 00000000bff8e000 - 00000000bffe0000 (ACPI NVS)
Dec 21 08:01:06 crm kernel:  BIOS-e820: 00000000bffe0000 - 00000000c0000000 (reserved)
Dec 21 08:01:06 crm kernel:  BIOS-e820: 00000000ffb00000 - 0000000100000000 (reserved)
Dec 21 08:01:06 crm kernel:  BIOS-e820: 0000000100000000 - 0000000240000000 (usable)
Dec 21 08:01:06 crm kernel: DMI 2.4 present.

Който може, силно моля да ме посъветва как да открия причината за тези самоволни рестартирания.


Титла: Re: Неочаквани REBOOT-и
Публикувано от: sickmind в Dec 21, 2010, 12:10
пусни му един memtest за всеки случай, може да е от рам паметта щом не пише нищо по логовете.


Титла: Re: Неочаквани REBOOT-и
Публикувано от: n00b в Dec 21, 2010, 13:38
Пробвай да си поиграеш с паметта примерно 2х2Г докато откриеш дефектния модул.


Титла: Re: Неочаквани REBOOT-и
Публикувано от: morbid_viper в Dec 21, 2010, 15:55
със сигурност е от паметта… провери техническите данни на дъното и виж дали е напълно поддържана тоя тип памет, който си сложил. не е изключено и да е дефектна паметта. както посъветва sickmind – пусни си един memtest.


Титла: Re: Неочаквани REBOOT-и
Публикувано от: tmcdos в Dec 21, 2010, 16:05
Дъното е ASUS P5W64WS Pro, паметите са KINGSTON 2GB DDR2 800 HYPER X (KHX6400D2/2G) - дъното ги пуска на 533МХц.
С радиаторчета са, от едната страна ги духа вентилатора на професора, от другата им духат 3 перки по 12см (кутията е 3U rack).
За memtest имам затруднения, понеже сървъра се използва постоянно - дори уикендите да няма никой в офиса, от чужбина си го достъпват агентите. Играта с размяна на памети предполага поне 4 опита (с всяка памет отделно) - което означава резултати най-рано след 2 месеца ....


Титла: Re: Неочаквани REBOOT-и
Публикувано от: n00b в Dec 21, 2010, 17:10
Насадил си се на пачи яйца...

Никога, повтарям НИКОГА хардуер не се слага в production без да се тества.


Титла: Re: Неочаквани REBOOT-и
Публикувано от: laskov в Dec 21, 2010, 17:30
Според мен не е от паметта. Когато е памет, не веднъж на 10 дни, а 10 на ден щяха да са рестартиранията.
2-ро - Защо се рестартира, а не остава забил с kernel panic ? Досега май при такъв проблем не ми се е случвало да се рестартира, но може това да е въпрос на настройка.
3-то Преди да се рестартира виждам
Цитат
Dec 21 05:33:12 crm smartd[2703]: Device: /dev/hda, 2 Currently unreadable (pending) sectors
Dec 21 05:33:12 crm smartd[2703]: Device: /dev/hda, 2 Offline uncorrectable sectors
Това, отнесено и към честотата на рестартиранията, може да е истинския проблем.


Титла: Re: Неочаквани REBOOT-и
Публикувано от: Acho в Dec 21, 2010, 17:41
И на мен ми намирисва на дискова болка. Копирай диска на друг (проверен/читав) хард диск и го смени. Тия UNREADABLE-та хич не са добре. А и са ползвани поне 5 години, никак не са нови. А за RAM-а, ами спри машината за 5 минути и върни старите модули за проба. Нали с тях и бичил 5 години. И ще си покаже.


Титла: Re: Неочаквани REBOOT-и
Публикувано от: tmcdos в Dec 21, 2010, 18:39
Това с 2-та нечитаеми сектора го има откакто е купен диска (5 години), никаква болка не е.
Между другото за kernel_panic - настройката в GRUB.CONF e
Код:
kernel /vmlinuz-2.6.28-mod ro panic=60 root=LABEL=/

Може би ако махна 60-те секунди (няма нищо общо с филма "Да изчезнеш за 60 секунди") - когато забие ще има някакво смислено съобщение на екрана ?
Макар че моите подозрения са нещо софтуерно - но не знам как да го хвана ....


Титла: Re: Неочаквани REBOOT-и
Публикувано от: Acho в Dec 21, 2010, 19:21
Ами като сложиш здрав диск с нова инсталация на тая машина. С инсталация, в която да не се съмняваш.


Титла: Re: Неочаквани REBOOT-и
Публикувано от: tmcdos в Dec 21, 2010, 19:37
Както обикновено, ще трябва да се боря сам.
Благодарско за съчувствието.


Титла: Re: Неочаквани REBOOT-и
Публикувано от: nemanema в Dec 21, 2010, 22:24
Здрасти !
Преди да кажа каквото и да е, да предупредя, че мнението е мое и не трябва никой да се ангажира с каквото и да е !
На питащия - пич, ако половината което е написано на сайта ти е вярно, не е необходимо да ти се помага !
На въпроса ти - да, рестартите са от памет !
Защо - защото така набедената машина за сървър е за работна станция с живот до 5 години максимум, изтерзана в псевдо кутия.
Какво може да се направи !? Хм, аз бих обновил БИОС, след това ще почистя слота за плочките памет. Когато купувам памет, ще проверя дали дъното може с наличният компенсатор да нахрани с 1,85 волта всяка поставена плочка с памет. След това в БИОС внимателно ще огледам дали няма ограничител на използваната памет, и бих направил настройки отново. И след всичко това преди да монтирам новата памет ще тествам, като не очаквам честотната лента на пропускане да надвиши 667 в двоен режим. Когато се напъне паметта да работи на таван 800, дали северният мост на схемният набор има физическа възможност да пропусне толкова ? Нали за KINGSTON 2GB DDR2 800 HYPER X (KHX6400D2/2G) с клок 5-5-5-15 говорим все пак. Какво казва производителя на дъното? А междувременно бих огледал електролитните кондензатори около процесорния цокъл, като не забравя да почистя изпарения и разпрашен полепнал арсеник. След това ще направя основен преглед на захранващия блок и сериозно бих се замислил да го сменя, ако има флуктуации на напреженията.
И не желая да се приеме като заяждане или обидни квалификации написаното от мен. Ако някой се е обидил от прямото ми отношение, тогава ще се извиня в името на добрия тон.

П. Не че ми е работа, но кога на въпросната F6 за последно е правен update-pciids ? Цитираната ОС не е ли малко старичка
П.П. Само съвет, най приятелски и с най-добри намерения: смени желязото, ако не цялото, то поне с нови САТА дискове и малко по-прясна ОС.

Успех !
И не както обикновено се налага да се бориш сам ;) Но ако си единак и те кефи това, ОК !


Титла: Re: Неочаквани REBOOT-и
Публикувано от: Acho в Dec 22, 2010, 09:40
@Nemanema, кой е сайта, да го скиваме ? Че то май си е така, на сайта <НИЕ СМЕ НАЙ-ГОЛЕМИТЕ СПЕЦОВЕ, ВСИЧКО ОПРАВЯМЕ>


Титла: Re: Неочаквани REBOOT-и
Публикувано от: Naka в Dec 22, 2010, 10:51
Със сигурност хардуерен проблем.
Научете се да го гледате това smartctl. Пише ти че имаш минимум 2 Bad Сектора. (2 Offline uncorrectable sectors)

Причините за рестарта може да са свързани с това а може и да не са - най вероятно рестартите нямат нищо общо с  Bad Секторите. Не ми се вярва и да е от паметта. С KINGSTON е нямало никога проблеми.

Този компютър има ли UPS? Ако няма, когато има много малък токов удар (например луминисцентните лампи прегимнат почти незабележимо) обикновенно компютрите се рестартират. Виж си и дъното дали няма подути кондензатори. http://en.wikipedia.org/wiki/Capacitor_plague

Такива проблеми абсолютно Не могът да се засекът с memtest. memtest Засича само твърдо избита памет. Ако имаш такава, даже и няма да може да бутне правилно - няма и да работи и 1 минута.

Възможно е и дъното да не се разбира много много с паммета. Ако паметта работи в DualChanel сложи я в Single. Друго което се прави е да и вдигнеш циклите на макс от BIOS-a. CAS Latency е най важно......... това е HYPER X памет и тя има много ниски цикли - много е вероятно дъното да не се разбира с паметта. Затова вдигай всички цикли.



Титла: Re: Неочаквани REBOOT-и
Публикувано от: tmcdos в Dec 22, 2010, 12:23
Браво, активизирахте се.

@nemanema
1) Моля за дефиниция на "псевдо кутия"-та.
2) Паметта допуска 800 МХц, а съм сигурен че и над 800 ще издържи - но чипсета на дъното не може да подкара повече от 533МХц, когато е инсталиран максималния обем памет (8ГБ в случая)
3) приемам съвета за измерването на захранването
4) PCI.ids е от 27-12-2008; ОС-а е стар - не може да се отрече обаче, че и новите си имат проблеми. Категорично не съм привърженик, че щом се промени младшата цифра на някой софтуер, обезателно трябва се инсталира на всички достъпни машини. Последиците от моето решение могат да бъдат както добри, така и лоши - от противоположното решение последиците също могат да бъдат добри или лоши.
5) желязо сменям чак когато се строши

@naka
1) Компютъра е свързан към UPS с мощност 2400 VA, който се поддържа от 4 броя акумулатори за ТИР - изпробван е 3 пъти досега, и 3-те пъти издържа по 5 часа и нещо.
2) споделям мнението ти за memtest
3) приемам съвета за циклите на паметта


Титла: Re: Неочаквани REBOOT-и
Публикувано от: Naka в Dec 22, 2010, 12:54
Цитат
3) приемам съвета за измерването на захранването
Рестарти могат да се дължат и на захранване. Обаче е невъзможно да се измери захранване. Имам в предвид че даже и да се измери статично ще покаже всичко наред, но много трудно може да се засекат динамични проблеми - т.е. често от оттам също идват рестарти. Импулсните захранванията също много се изтъркват - след 2-3 вече не е същото. Проблемите обикновенно са същите - изсъхнали или подути кондензатори.

Такъв проблем със рестарти също може да се дължи на захранване!!! Но трудно се хваща. При мен като мине едно захранване 2,3-4 години и се усъмня че ми прави проблеми го сменям.
 


Титла: Re: Неочаквани REBOOT-и
Публикувано от: nemanema в Dec 22, 2010, 13:07
Поне един е попрочел малко по-сериозно коментара ми ! Предизвикателството действа, а това раздвижва съдържимото между ушите ! ;)
Движим по ред на номерата:

1) Моля за дефиниция на "псевдо кутия"-та.
- коментирам на база наличната информация към момента (опровержение със снимка) 3U монтажна кутия с 120 мм вентилатори прикачени на напречната релса е леко несериозно за машина в CRM производство.

2) Паметта допуска 800 МХц, а съм сигурен че и над 800 ще издържи - но чипсета на дъното не може да подкара повече от 533МХц, когато е инсталиран максималния обем памет (8ГБ в случая)
- да съм казал че неможе повече от 800 ? да съм поставил под съмнение паметта ? не, казах да се провери подаваното напрежение и чифтовото комплектоване на плочките, като се почистят слотовете, а въпреки производителя и модела цитирана памет, пак трябва да се провери !

3) приемам съвета за измерването на захранването
- предполагам, че на въпросната кутия е монтирано стандартно захранване за десктоп, а технологично, че е от висок клас не го прави вечно ;)

4) PCI.ids е от 27-12-2008; ОС-а е стар - не може да се отрече обаче, че и новите си имат проблеми. Категорично не съм привърженик, че щом се промени младшата цифра на някой софтуер, обезателно трябва се инсталира на всички достъпни машини. Последиците от моето решение могат да бъдат както добри, така и лоши - от противоположното решение последиците също могат да бъдат добри или лоши.
- добре е, че си с прилично обновена база в ОС за железарията, но БИОС ? Предполагам че си виждал коментарите за проблемите на F6  и BIOS-e820 при различни конфигурации на схемни набори от различни производители ?!

5) желязо сменям чак когато се строши
- не съм аз човека, който да ти мери джоба и да ти казва какво и как да правиш, а още по-малко ми е работа ! ;)

Само елементарно любопитство: колко диска буташ на този CRM, та се налага да са в такава кутия ?

П. Възползвай се от празниците и оправи работата на дъното с паметта.
Успех !


Титла: Re: Неочаквани REBOOT-и
Публикувано от: tmcdos в Dec 22, 2010, 15:12
@nemanema
1) Кутията я купих от магазина на Hardware.BG - възможно е да са ме взели за баламурник и да са се отървали от някоя "псевдо кутия". Захранването е 750 вата - комплект с кутията (демек не е десктоп захранване).
2) думите, на които отговорих, бяха "като не очаквам честотната лента на пропускане да надвиши 667 в двоен режим. Когато се напъне паметта да работи на таван 800, дали северният мост на схемният набор има физическа възможност да пропусне толкова ?"
3) приемам забележката за BIOS - ще го обновя

В кутията се предвижда да се сложат 16 диска - в някакъв момент от бъдещето. В момента има 7 диска вътре.