NMI е non-maskable interrupt и обикновено се генерира при някой кофти хардуерен проблем.
В зависимост от NMI прекъсването се идентифицира къде е проблемът...по принцип обаче.
Използва се и при NMI watchdog механизъма, където се генерира изкуствено всяка секунда и ако един от процесорите не го обработи поради някаква причина, тогава ядрото приема, че този процесор поради някаква причина е сдал багажа, като съответно взема разни мерки свързани с task scheduling-a.
Възможно е да е проблем с РАМ-та, обаче тези пусти NMIs не са много коректно обработвани, всеки производител на дъна си знае своето, така че спокойно може да е проблем и на някоя карта на PCI шината също така. Направи тестове с memtest86 да видиш.
При HP сървърите има една дивня, наречена iLO, за която може да се говори надълго и нашироко. Накратко, това е отделен management board, свързан с мрежов интерфейс, през който може да се рестартира/бърника сървъра, има виртуална конзола и т.н. Там има една опция "generate NMI", която на теория трябва да halt-не ядрото. Забавното е че не винаги го прави, така че дори линукс ядрата си имат собствено мнение по въпроса.
Въобще цялата тая работа доста напомня на ACPI, хаха

'>