Автор Тема: Рестарт на FreeBSD 7.0 с грешка "Fatal trap 12: page fault while in kernel mode"  (Прочетена 14630 пъти)

mrowcp

  • Напреднали
  • *****
  • Публикации: 450
    • Профил
Здравейте,
От няколко месеца, профилактично, въпросното FreeBSD се рестартира, без видима причина, напълно рандом. Пуснато е на VMWare център. Ето какво има в лога (vmcore):

Код
GeSHi (Bash):
  1. Fatal trap 12: page fault while in kernel mode
  2. cpuid = 1; apic id = 01
  3. fault virtual address   = 0x18
  4. fault code              = supervisor write, page not present
  5. instruction pointer     = 0x20:0xc0839301
  6. stack pointer           = 0x28:0xe6992be8
  7. frame pointer           = 0x28:0xe6992c58
  8. code segment            = base 0x0, limit 0xfffff, type 0x1b
  9.                        = DPL 0, pres 1, def32 1, gran 1
  10. processor eflags        = interrupt enabled, resume, IOPL = 0
  11. current process         = 32 (dummynet)
  12. trap number             = 12
  13. panic: page fault
  14. cpuid = 1
  15. Uptime: 22d0h37m29s
  16. Physical memory: 3059 MB
  17. Dumping 260 MB: 245 229 213 197 181 165 149 133 117 101 85 69 53 37 21 5
  18.  
  19. #0  doadump () at pcpu.h:195
  20. 195             __asm __volatile("movl %%fs:0,%0" : "=r" (td));

Следвам това ръководство и стигнах до:

Код
GeSHi (Bash):
  1. (kgdb) list *0xc0839301
  2. 0xc0839301 is in ready_event_wfq (../../../netinet/ip_dummynet.c:700).
  3. 695         if (p->if_name[0]==0 && p->numbytes < 0) { /* this implies bandwidth >0 */
  4. 696             dn_key t=0 ; /* number of ticks i have to wait */
  5. 697
  6. 698             if (p->bandwidth > 0)
  7. 699                 t = ( p->bandwidth -1 - p->numbytes) / p->bandwidth ;
  8. 700             dn_tag_get(p->tail)->output_time += t ;
  9. 701             p->sched_time = curr_time ;
  10. 702             heap_insert(&wfq_ready_heap, curr_time + t, (void *)p);
  11. 703             /* XXX should check errors on heap_insert, and drain the whole
  12. 704              * queue on error hoping next time we are luckier.
  13. (kgdb) backtrace
  14. #0  doadump () at pcpu.h:195
  15. #1  0xc0755537 in boot (howto=260) at ../../../kern/kern_shutdown.c:409
  16. #2  0xc07557f9 in panic (fmt=Variable "fmt" is not available.
  17. ) at ../../../kern/kern_shutdown.c:563
  18. #3  0xc0a63d6c in trap_fatal (frame=0xe6992ba8, eva=24) at ../../../i386/i386/trap.c:899
  19. #4  0xc0a63ff0 in trap_pfault (frame=0xe6992ba8, usermode=0, eva=24) at ../../../i386/i386/trap.c:812
  20. #5  0xc0a6499c in trap (frame=0xe6992ba8) at ../../../i386/i386/trap.c:490
  21. #6  0xc0a4a91b in calltrap () at ../../../i386/i386/exception.s:139
  22. #7  0xc0839301 in ready_event_wfq (p=0xc6443e00, head=0xe6992c8c, tail=0xe6992c88)
  23.    at ../../../netinet/ip_dummynet.c:700
  24. #8  0xc083a965 in dummynet_task (context=0x0, pending=1) at ../../../netinet/ip_dummynet.c:799
  25. #9  0xc0784fb5 in taskqueue_run (queue=0xc6591d80) at ../../../kern/subr_taskqueue.c:255
  26. #10 0xc07851bb in taskqueue_thread_loop (arg=0xc0c02990) at ../../../kern/subr_taskqueue.c:374
  27. #11 0xc0735559 in fork_exit (callout=0xc0785100 <taskqueue_thread_loop>, arg=0xc0c02990,
  28.    frame=0xe6992d38) at ../../../kern/kern_fork.c:781
  29. #12 0xc0a4a990 in fork_trampoline () at ../../../i386/i386/exception.s:205
  30. (kgdb)

Рових малко в google и стигнах до няколко подобни проблеми, като всичко там води към натрупване на грешки по интерфейса. Като проверя моите, излиза следното:

Код
GeSHi (Bash):
  1. netstat -i -b -n -I le3
  2. Name    Mtu Network       Address              Ipkts Ierrs     Ibytes    Opkts Oerrs     Obytes  Coll
  3. le3    1500 <Link#4>      00:*:56:*:65:* 13041589   522 2744708145  8512484     0  845707843     0
  4. le3    1500 95.*.128.* 95.*.128.*     1519887     -  884665643  8512371     -  726528457     -

Код
GeSHi (Bash):
  1. netstat -i -b -n -I le1
  2. Name    Mtu Network       Address              Ipkts Ierrs     Ibytes    Opkts Oerrs     Obytes  Coll
  3. le1    1500 <Link#2>      00:*:26:*:35:* 12998056   650 1843494915 17158552     0 3861703475     0
  4. le1    1500 192.168.1.0/ 192.168.1.1        795085     -   97119029   971136     -  716719789     -

Следва проверка с: sysctl -a | grep dev.le , но тук ми излизат само:
Код
GeSHi (Bash):
  1. dev.le.1.%desc: AMD PCnet-PCI
  2. dev.le.1.%driver: le
  3. dev.le.1.%location: slot=18 function=0
  4. dev.le.1.%pnpinfo: vendor=0x1022 device=0x2000 subvendor=0x1022 subdevice=0x2000 class=0x020000
  5. dev.le.1.%parent: pci0

което явно е в следствие липсата на DEBUG режим зададен в кърнела?В примерите (тук и тук които гледам, има редовете със stats.rx
Пример:

Код
GeSHi (Bash):
  1. dev.bge.0.stats.rx.FCSErrors: 0
  2. dev.bge.0.stats.rx.AlignmentErrors: 0
  3. dev.bge.0.stats.rx.xonPauseFramesReceived: 0
  4. dev.bge.0.stats.rx.xoffPauseFramesReceived: 0
  5. dev.bge.0.stats.rx.ControlFramesReceived: 0
  6. dev.bge.0.stats.rx.xoffStateEntered: 0
  7. dev.bge.0.stats.rx.FramesTooLong: 799

Интересното е, че имам друго FreeBSD, пуснато на същия този виртуален ценър, има доволно много грешки:

Код
GeSHi (Bash):
  1. netstat -i -b -n -I le0
  2. Name    Mtu Network       Address              Ipkts Ierrs     Ibytes    Opkts Oerrs     Obytes  Coll
  3. le0    1500 <Link#1>      00:*:56:*:51:* 408290228 27731 2348559573 180869579     0 1882814631     0
  4. le0    1500 192.168.1.0/ 192.168.1.102    148512144     - 3975305044 166778260     - 2743899286     -

. но няма никакви проблеми с него и има почти две години ъптайм.

Като цяло питането ми е, правилно ли съм се насочил (активиране на DEBUG и прекомпилиране) или да търся нещо друго?

« Последна редакция: Mar 15, 2015, 19:15 от mrowcp »
Активен

Some Things Just Are The Way They Are

solarflux

  • Напреднали
  • *****
  • Публикации: 100
    • Профил
netstat -m

sysctl kern.ipc.nmbclusters


7 е EOL преди 6 години, защо не ъпгрейднеш до 9.1?

не разбирам особено руски но виж и http://www.opennet.ru/base/sys/freebsd_panic_solution.txt.html

все пак ъпгрейд...
Активен

mrowcp

  • Напреднали
  • *****
  • Публикации: 450
    • Профил
netstat -m

sysctl kern.ipc.nmbclusters


7 е EOL преди 6 години, защо не ъпгрейднеш до 9.1?

не разбирам особено руски но виж и http://www.opennet.ru/base/sys/freebsd_panic_solution.txt.html

все пак ъпгрейд...

Код
GeSHi (Bash):
  1. #netstat -m
  2. 36/1884/1920 mbufs in use (current/cache/total)
  3. 13/1567/1580/25600 mbuf clusters in use (current/cache/total/max)
  4. 0/512 mbuf+clusters out of packet secondary zone in use (current/cache)
  5. 0/119/119/12800 4k (page size) jumbo clusters in use (current/cache/total/max)
  6. 0/0/0/6400 9k jumbo clusters in use (current/cache/total/max)
  7. 0/0/0/3200 16k jumbo clusters in use (current/cache/total/max)
  8. 35K/4081K/4116K bytes allocated to network (current/cache/total)
  9. 0/0/0 requests for mbufs denied (mbufs/clusters/mbuf+clusters)
  10. 0/0/0 requests for jumbo clusters denied (4k/9k/16k)
  11. 0/73/6656 sfbufs in use (current/peak/max)
  12. 0 requests for sfbufs denied
  13. 0 requests for sfbufs delayed
  14. 7 requests for I/O initiated by sendfile
  15. 0 calls to protocol drain routines
  16.  
  17. # sysctl kern.ipc.nmbclusters
  18. kern.ipc.nmbclusters: 25600

За ъпгрейд и аз се замислям, но има някой неща които ме притеснява да не се счупят.


EDIT:

Тъй като 35K/4081K/4116K bytes allocated to network (current/cache/total) ми грабна окото и почнах пак да ровя, попаднах на няколко интересни неща. Едното е

(FIXED) Network mbuf Leak / Exhaustion in FreeBSD 9.0 / 9.1

Хардуеъра пак е DELL и пак става дума за VMWare. Питането ми е, как точно да приложа този пач, за да не омажа нещо и изобщо подходящ ли е за мен, след като там се прилага на 9.0 , а аз съм с 7.0

Другото интересно е изхода от командата:

Код
GeSHi (Bash):
  1. netstat -i -w 1
  2.            input        (Total)           output
  3.   packets  errs      bytes    packets  errs      bytes colls
  4.      2167     0    1379324       2385     0    2006399     0
  5.      1759     0    1219967       1975     0    1820319     0
  6.      1762     0    1173325       1975     0    1771865     0
  7.      3973     0    2048293       4367     0    3164761     0
  8.      4797     0    1846254       5030     0    2543221     0
  9.      3504     0    1458508       3705     0    2054196     0
  10.      2115     0    1554739       2216     0    1894367     0
  11.      2212     1    1484002       2533     0    2392537     0
  12.      9573     5    7839601      12353     0   14573350     0
  13.      9594     5    8082062      12598     0   15286981     0
  14.      9560     6    8077210      12497     0   15133796     0
  15.      9904     7    8153599      12835     0   15304480     0
  16.     11425     7    9625388      14974     0   18238077     0
  17.     11353     9    9481029      14816     0   17864126     0
  18.     12814     4   10335644      16579     0   19374355     0
  19.      9452     7    7778154      12246     0   14551521     0
  20.     11317     8    9533213      14887     0   18043389     0
  21.      7649     3    6345857       9931     0   11812625     0
  22.      9019     2    6945061      11518     0   12721038     0
  23.      6832     1    4976888       8380     0    8712343     0
  24.     12726    12   10850582      15599     0   17323673     0

Тези грешки на входа трябва ли да ме притесняват?


« Последна редакция: Mar 17, 2015, 12:49 от mrowcp »
Активен

Some Things Just Are The Way They Are

koue

  • Напреднали
  • *****
  • Публикации: 74
  • Distribution: FreeBSD
  • Window Manager: fluxbox
    • Профил
Направи нова виртуална машина и мигрирай каквото ти трябва. Вода и от десет кладенеца да носиш не означава, че някой не се е изпикал в тях.
Активен

Спрете да им прощавате, че не знаят какво правят!

solarflux

  • Напреднали
  • *****
  • Публикации: 100
    • Профил
Вместо да се занимаваш с индивидуални пачове
https://www.freebsd.org/doc/handbook/updating-upgrading-freebsdupdate.html

според https://www.freebsd.org/releases/10.0R/installation.html не би трябвало да има проблеми между последния пач левъл на 7 и 10.0, но все пак си с виртуална машина, така че аз бих си направил един клон за тест и бих пробвал там (или снапшот или квот и да е стига да има вариант за бърз ролбек)...

от личния ми опит с freebsd-update между версии, винаги е било безпроблемно или в най-лошия случай проблемите са вече документирани и има решения

след като си с 10.0 можеш да ъпдейтнеш до 10.1, и ако и след това продължаваш да имаш проблем - да отвориш ПР
Активен