Автор Тема: ksoftirqd - "изяжда" ми ресурсите  (Прочетена 1783 пъти)

VladSun

  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
Проблемът се появи преди 2 дена :
Примерен код

top - 14:32:23 up 2 days, 21:52,  2 users,  load average: 1.99, 2.53, 1.88
Tasks:  62 total,   1 running,  61 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.5% us,  0.0% sy,  0.0% ni,  1.6% id,  0.0% wa, 14.3% hi, 83.6% si
Mem:    383744k total,   373896k used,     9848k free,    98364k buffers
Swap:   546200k total,        0k used,   546200k free,   152148k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
    3 root      34  19     0    0    0 S 31.9  0.0  11:16.69 ksoftirqd/0
22634 root      16   0  5836 1696 5436 S 28.1  0.4   0:38.22 sshd
15479 root      15   0  3696 1484 2596 S  5.7  0.4   2:39.27 nmbd
23644 root      17   0  1928 1020 1776 R  5.7  0.3   4:08.24 top
 2889 mysql     16   0 32996  12m 4120 S  3.3  3.4   1:36.35 mysqld
 2748 root      16   0  4384 2072 3736 S  1.0  0.5   0:19.60 httpd
    1 root      16   0   480  240  456 S  0.0  0.1   0:08.81 init
    2 root      RT   0     0    0    0 S  0.0  0.0   0:00.00 migration/0
    4 root       5 -10     0    0    0 S  0.0  0.0   0:01.37 events/0
    5 root      13 -10     0    0    0 S  0.0  0.0   0:00.00 khelper
    6 root      14 -10     0    0    0 S  0.0  0.0   0:00.00 kacpid
   17 root       5 -10     0    0    0 S  0.0  0.0   0:06.14 kblockd/0
   27 root      20   0     0    0    0 S  0.0  0.0   0:00.00 pdflush
   28 root      15   0     0    0    0 S  0.0  0.0   1:12.32 pdflush
   30 root       9 -10     0    0    0 S  0.0  0.0   0:00.00 aio/0
   29 root      15   0     0    0    0 S  0.0  0.0   0:00.09 kswapd0
  121 root       6 -10     0    0    0 S  0.0  0.0   0:00.00 ata/0
  122 root      16   0     0    0    0 S  0.0  0.0   0:00.00 khpsbpkt
  125 root      17   0     0    0    0 S  0.0  0.0   0:00.00 kseriod
  126 root       5 -10     0    0    0 S  0.0  0.0   0:20.97 reiserfs/0
  276 root       6 -10  1324  344 1296 S  0.0  0.1   0:00.00 udevd
  718 root      16   0  1624  664 1432 S  0.0  0.2   0:20.90 syslogd
  721 root      15   0  1468  452 1308 S  0.0  0.1   0:07.00 klogd
  787 bin       16   0  1488  596 1432 S  0.0  0.2   0:00.00 rpc.portmap
 2700 root      22   0  1380  524 1348 S  0.0  0.1   0:00.00 inetd
 2703 root      16   0  3140 1412 2876 S  0.0  0.4   0:09.41 sshd
 2711 root      16   0  1456  560 1420 S  0.0  0.1   0:06.87 crond
 2715 root      18   0  1344  524 1304 S  0.0  0.1   0:00.00 acpid
 2717 root      16   0  1384  452 1352 S  0.0  0.1   0:00.00 gpm
 2719 root      17   0  2160 1100 2044 S  0.0  0.3   0:00.05 safe_mysqld
 2723 root      16   0  8552 6560 3976 S  0.0  1.7  12:10.17 named
 2747 mysql     15   0 32996  12m 4120 S  0.0  3.4   0:00.91 mysqld
 2750 www       16   0  4576 2912 3736 S  0.0  0.8   0:02.15 httpd


uname -a
Linux 2.6.8 #2 SMP Thu Oct 28 17:28:21 EEST 2004 i686 unknown unknown GNU/Linux




cat /proc/interrupts
           CPU0
  0:  252285558          XT-PIC  timer
  2:          0          XT-PIC  cascade
  9:          0          XT-PIC  acpi
 10:  332074744          XT-PIC  TLAN
 11:  411075784          XT-PIC  eth1
 14:     810084          XT-PIC  ide0
NMI:          0
LOC:  252292804
ERR:          0
MIS:          0



и машината почти "умира" - едва успявам да пусна SSH връзка. Ако я оставя така се оправя от само себе си, ама не се знае колко време ще трябва (пък и това не е решение).
Четох из Google, ама никъде не дават решение на проблема (или поне аз не открих).
Някой с идеи/решения?
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

hary

  • Напреднали
  • *****
  • Публикации: 73
    • Профил
ksoftirqd - "изяжда" ми ресурсите
« Отговор #1 -: Jan 27, 2005, 17:48 »
Като имаш едно CPU за какво ти е SMP кернел не разбирам. Може това да е някакав проблем, пробвай кернел без SMP
Активен

VladSun

  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
ksoftirqd - "изяжда" ми ресурсите
« Отговор #2 -: Jan 27, 2005, 21:21 »
Цитат (hary @ Ян. 27 2005,17:48)
Като имаш едно CPU за какво ти е SMP кернел не разбирам. Може това да е някакав проблем, пробвай кернел без SMP

еми не знам - инсталирал съм го много отдавна (настройките за процесор всъщност изобщо не ги пипам в menuconfig преди компилацията на kernel-a)....

НО ПРОБЛЕМЪТ НЕ В ТОВА... тоя kernel го ползвам от наистина много време, а както споменах проблемът е от 2-3 дена...

Според наблюденията ми, може би има нещо общо с named - имам АДСКИ много редове с:

Примерен код

Jan 23 11:58:39 named[2722]: lame server resolving 'drones.rrouting.net' (in 'rrouting.NET'?): 67.43.233.133#53
Jan 23 11:58:39 named[2722]: lame server resolving 'drones.rrouting.net' (in 'rrouting.NET'?): 67.43.233.132#53
Jan 23 11:58:43 named[2722]: lame server resolving 'drones.rrouting.net' (in 'rrouting.NET'?): 216.109.116.20#53
Jan 23 11:58:43 named[2722]: lame server resolving 'drones.rrouting.net' (in 'rrouting.NET'?): 66.218.71.205#53
Jan 23 11:58:43 named[2722]: lame server resolving 'drones.rrouting.net' (in 'rrouting.NET'?): 67.43.233.132#53
Jan 23 11:58:44 named[2722]: lame server resolving 'drones.rrouting.net' (in 'rrouting.NET'?): 67.43.233.133#53
Jan 23 11:58:47 named[2722]: lame server resolving 'drones.rrouting.net' (in 'rrouting.NET'?): 216.109.116.20#53
Jan 23 11:58:48 named[2722]: lame server resolving 'drones.rrouting.net' (in 'rrouting.NET'?): 66.218.71.205#53


 и така от доста време ...
Не знам дали наистина е свързано с проблема, но вече във всичко се съмнявам ...

Другото, което наскоро съм прoменял е добавянето loging от iptables:
$ipt -t mangle -N LOG_CHAIN
$ipt -A INT_IN -t mangle -m dscp --dscp ! 0x30 -j LOG_CHAIN
$ipt -t mangle -A LOG_CHAIN -m limit --limit 5/m --limit-burst 5 -j LOG --log-level info --log-prefix '### INT-BG ###'
$ipt -t mangle -A LOG_CHAIN -j RETURN

с което провеярявам дали пакетите маркирани от моя доставчик като ИНТ-трафик, не са БГ-трафик, но не съм много сигурен, че това може да е причина.

И още няколко неща:
1) рестарт-а напълно оправя нещата;
2) някои от коментарите по тоя проблем се разискват в контекста на Repotec LAN card - едната от ЛАН картите ми е такава, другата е TLAN (казвам го защото мнооогоо проблеми ми направи),

 но всичко това не обяснява внезапността на проблема ...
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

VladSun

  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
ksoftirqd - "изяжда" ми ресурсите
« Отговор #3 -: Feb 03, 2005, 01:27 »
Все още продължавам да имам - много спорадично - този проблем.
Според това проблемът може би се дължи или на бъг в iptables или на бъг в LAN драйвера RLT8139.

Някой друг да се е сблъсквал с този проблем?

ПС. Забелязва, че понякога (1 на 20 пъти примерно) като пусна iptraf и машината умира, което според мен се дължи на влизане в "promiscuous mode" на ЛАН картите, което от своя страна довежда до натоварване на процесора. Твърде вероятно е това да е свързано с гореописания проблем ...
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

savel

  • Напреднали
  • *****
  • Публикации: 52
    • Профил
ksoftirqd - "изяжда" ми ресурсите
« Отговор #4 -: Feb 03, 2005, 19:02 »
проблема хич не е в SMP '<img'>

обаче толкова ли е трудно да си update-неш ядрото ? '<img'>
Активен

VladSun

  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
ksoftirqd - "изяжда" ми ресурсите
« Отговор #5 -: Feb 04, 2005, 12:18 »
Цитат (savel @ Фев. 03 2005,19':0')
1) проблема хич не е в SMP <!--emo&'<img'>

2) обаче толкова ли е трудно да си update-неш ядрото ? '<img'>

1) Това иронично ли беше или не?
Сериозно питам '<img'>

2) Не обичам много да пипам неща, които работят стабилно - все пак това е сървер и не мога да си повече от 15 мин. играя с него (иначе ако знаеш какъв рев настава). За това не искам да ъпдейтвам (а и не смятам, че е най доброто решение да се слага най-последната версия на каквото и да било - още не им знаят бъговете '<img'> )
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

  • Гост
ksoftirqd - "изяжда" ми ресурсите
« Отговор #6 -: Feb 04, 2005, 13:42 »
Цитат

За това не искам да ъпдейтвам (а и не смятам, че е най доброто решение да се слага най-последната версия на каквото и да било - още не им знаят бъговете '<img'> )


на новите неща не им се знаят бъговете, но на старите им се знаят много добре, и именно заради това се update-ва '<img'>
Активен

VladSun

  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
ksoftirqd - "изяжда" ми ресурсите
« Отговор #7 -: Feb 04, 2005, 14:53 »
Е да, ама ако ме хакнат заради някакъв нов експлоит за новите бъгове, дето още не е много известен става МНООООГОООООО зле ...
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

VladSun

  • Напреднали
  • *****
  • Публикации: 2166
    • Профил
ksoftirqd - "изяжда" ми ресурсите
« Отговор #8 -: Feb 05, 2005, 00:50 »
Пак съм аз '<img'>

Днес открих, че ЛАН картата с вътрешния интерфейс отговаря на arping към (според мен безразборно) ИП-та, които изобщо не са й alias-нати - около 10 отговора при сканиране на мрежата от 192.168.0.1 до 192.168.255.1.
Ясно е, че ще я сменя, но дали това има връзка към проблема в тази тема?
Активен

KISS Principle ( Keep-It-Short-and-Simple )
http://openfmi.net/projects/flattc/
Има 10 вида хора на този свят - разбиращи двоичния код и тези, които не го разбират :P

Подобни теми
Заглавие Започната от Отговора Прегледи Последна публикация
"Grub" sled preinstalacia na Windows
Настройка на програми
merman 1 2642 Последна публикация May 25, 2003, 11:27
от wandererbg
HDD ext3 recover, "Stellar Phoenix Linux" ??
Настройка на хардуер
help40 3 5098 Последна публикация Sep 20, 2012, 21:51
от Acho
"paskal case" / "camel case"
Общ форум
Apache 3 5608 Последна публикация Aug 11, 2006, 10:01
от ivak
Проблем с "struct cdev" и "struct semaphore"
Общ форум
halturata 22 10318 Последна публикация Aug 14, 2007, 17:31
от tarator
Проблем с "reboot", "halt" и т.н.
Настройка на програми
turboshark 5 5514 Последна публикация Sep 22, 2007, 00:13
от turboshark