Mamy kilkadziesiąt serwerów Proxmox (Proxmox działa na Debianie), a mniej więcej raz w miesiącu jeden z nich będzie miał panikę jądra i blokuje się. Najgorsze w tych blokadach jest to, że gdy jest to serwer, który jest na innym przełączniku niż master klastra, wszystkie inne serwery Proxmox na tym przełączniku przestaną odpowiadać, dopóki nie znajdziemy serwera, który faktycznie się zawiesił i uruchomi się ponownie.
Gdy zgłosiliśmy ten problem na forum Proxmox, doradzono nam uaktualnienie do wersji Proxmox 3.1 i pracujemy nad tym od kilku miesięcy. Niestety, jeden z serwerów, które migrowaliśmy do Proxmox 3.1, został zamknięty w piątek z powodu paniki jądra, i znowu wszystkie serwery Proxmox, które były na tym samym przełączniku, były nieosiągalne przez sieć, dopóki nie zdołaliśmy zlokalizować uszkodzonego serwera i zrestartować go.
Cóż, prawie wszystkie serwery Proxmox na przełączniku ... Uważam za interesujące, że serwery Proxmox na tym samym przełączniku, które były jeszcze w wersji Proxmox 1.9, nie uległy zmianie.
Oto zrzut ekranu konsoli uszkodzonego serwera:
Po zablokowaniu serwera pozostałe serwery na tym samym przełączniku, na których działał także Proxmox 3.1, stały się nieosiągalne i wyrzucały następujące informacje:
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
...etc...
uname-wyjście zablokowanego serwera:
Linux ------ 2.6.32-23-pve #1 SMP Tue Aug 6 07:04:06 CEST 2013 x86_64 GNU/Linux
pveversion -v wyjście (w skrócie):
proxmox-ve-2.6.32: 3.1-109 (running kernel: 2.6.32-23-pve)
pve-manager: 3.1-3 (running version: 3.1-3/dc0e9b0e)
pve-kernel-2.6.32-23-pve: 2.6.32-109
Dwa pytania:
Jakieś wskazówki, co spowodowałoby panikę jądra (patrz obrazek powyżej)?
Dlaczego inne serwery na tym samym przełączniku i wersji Proxmox byłyby usuwane z sieci do momentu ponownego uruchomienia zablokowanego serwera? (Uwaga: na tym samym przełączniku były inne serwery, na których działała starsza wersja Proxmoxa w wersji 1.9, których to nie dotyczyło. Nie dotyczyło to również innych serwerów Proxmox w tym samym klastrze 3.1, które nie były na tym samym przełączniku.)
Z góry dziękuję za wszelkie porady.