Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: ku4ka в Jul 09, 2007, 12:36 Здравейте,
В dmesg има следното съобщение: " Losing some ticks... checking if CPU frequency changed" . При много голямо натоварване на машината, тя забива с "kernel panic". Машината е със следните парамeтри: OS: 64-битов RHEL 4.0. U4, kernel-2.6.9-42.ELsmp hardware: HP ProLiant DL380G5, 2 броя dual-core Intel® Xeon CPU 3.60GHz; RAM=12GB DDR2 Ъпдейт на кернела до версия: kernel-2.6.9-55.0.2.ELsmp не помогна. Единственото нещо, което засега върши работа, е добавяне на 2 kernel boot parameters: 'nohpet' и 'nopmtimer'. Понеже не съм сигурна, че това е най-доброто, което може да се направи за тази машина, бих искала да се допитам и до вас за съвети. Идеи? Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: Kalin в Jul 09, 2007, 17:39 http://lists.centos.org/pipermail/centos/2006-August/067772.html
http://forums.gentoo.org/viewtopic.php?t=191716 Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: ku4ka в Jul 09, 2007, 20:10 Благодаря ти за линковете, но тези вече съм ги чела:-)
Както вече отбелязах, с добавените два параметъра на кърнала машината работи, държи се доста стабилно и в dmesg не се появява съобщението за "losing ticks.." Споменатата машина в момента е продукционна и е част от клъстер, така, че дори и да се 'паникьоса' не е фатално, защото има кой да поеме нейните функции... Питането ми тук по-скоро е насочено към хора, които са имали точно този проблем. Би ми било интересно те какви методи за решаване на проблема са предприели. Примерно, съпорта на Red Hat препоръчва ъпдейтване на системата с Update5, последен за RHEL4, но не препоръчва промяна на каквито и да било кърнал параметри. За жалост Red Hat не дава гаранция, че дори след ъпдейта нещата ще се променят... И понеже ситуацията в момента е: "сървъра работи, но не е ясно докога", а до качване на Update 5 има няколко дни,затова ще съм БЛАГОДАРНА на всеки, който споедели мнение по темата:-) Поздрави, --S-- "Всеки вижда според това колко разбира"-Пикасо Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: smelkomar в Jul 09, 2007, 21:26 Интересува ме тези процесори Xeon имат ли throttling поддръжка. Ако да нищо чудно модула за управлението на тази екстра да прави проблем
Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: ku4ka в Jul 09, 2007, 22:08 "Bandwidth throttling helps provide quality of service (QoS) by limiting network congestion and server crashes."
Не е небходимо да има заявки отвън, че да се крашне сървъра:-) Примерно, вълшебната команда: dd if=/dev/zero of=/home/some_file bs=1024 count =20000000 върши "чудеса":-) P.S. Да поясня, хардуера е "минал" всики небхдодими тестове:-) Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: Uvigii в Jul 09, 2007, 23:18
Може би не мрежова ,а ЦПУ. пробвайте да забраните cpufrec Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: ku4ka в Jul 10, 2007, 16:11
Здравей, Демона cpufreqd не е стартиран и модула acpi_cpufreq не е зареден, ако това имаш пред вид.... Ако, пък, не съм те разбрала правилно, моля те, да ме извиниш и да поясниш какво точно си искал да кажеш....и с повечко думи...като за мен, моля:-) Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: gat3way в Jul 10, 2007, 17:57 Пробва ли само с nopmtimer?
Има няколко варианта - да използваш PM timer-a na ACPI (лоша идея), HPET (по-прецизен от старият таймер, ерго позволява по-малко времеделене, оттам по-голям responsiveness за днешните системи)...и старият таймер, интел 82нещоси.. Мисля, че не би трябвало да имаш проблеми с HPET. И не е кой знае колко добра идея да го забраниш, при положение че не е там проблема де.. Иначе, не съм имал такъв проблем де.. Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: Uvigii в Jul 10, 2007, 23:07
Точно. Но явно не е това. dmesg какво казва ? с повечко думи ? ![]() Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: ku4ka в Jul 26, 2007, 10:47 Здравейте отново,
Две седмици по-късно машината пак даде грешка в dmesg: lp: driver loaded but no devices found NET: Registered protocol family 10 Disabled Privacy Extensions on device ffffffff80405540(lo) IPv6 over IPv4 tunneling driver divert: not allocating divert_blk for non-ethernet device sit0 eth2: no IPv6 routers present eth0: no IPv6 routers present eth1: no IPv6 routers present Hangcheck: starting hangcheck timer 0.9.0 (tick is 30 seconds, margin is 180 seconds). Hangcheck: Using monotonic_clock(). Losing some ticks... checking if CPU frequency changed. С други думи "решението" с двата параметъра се оказва, че на практика не е решение:-) На машината в моманта е качен RHEL 4, Update5, но за жалост това не реши проблема-тиковете продължават да се губят:-( От "НР" съветват да се сложи най-новия BIOS и ако това не помогне, да се свържем с техните гурота в Индия, което най-вероятно ще стане още днес:-) Поздрави, --S-- Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: Kalin в Jul 26, 2007, 11:35 /off-topic: Благодаря ти, че се върна да споделиш. Това с БИОС-а може спокойно да е решение, дано...
Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: ku4ka в Jul 27, 2007, 10:29 ....за жалост и ъпдейт на БИОС-а не помогна:-(
Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: laskov в Jul 27, 2007, 11:25
Вие тук обсъждате нещо на много високо за мен ниво и може да ми се смеете, но ... Много тихо и плахо ми се иска да вметна: Да не би тоя процесор да прегрява ... ![]() Титла: Losing some ticks... checking if cpu frequency cha Публикувано от: ku4ka в Jul 31, 2007, 12:13 Кратко обяснение:
"When a system management Interrupt is issued (SMI, and industry-standard method of internal Communications, in the case of the DL380G4 it is supplied by the Intel Chipset), clock ticks are suspended. In RHEL 4 they changed the sampling rate to 1000 and when 100 ticks are missed it issues a warning." Приятен ден на всички линуксари:-) Поздрави, --S-- |