Mam dziwny sporadyczny problem z łącznością, który zdarza się raz na dwa tygodnie.
Pierwsza moja konfiguracja: korzystam z klastra pracy awaryjnej HyperV z dwoma fizycznymi hostami (node01 i node02). Na obu hostach działa serwer HyperV systemu Windows Server 2008 R2 (darmowy) z dodatkiem SP1. Na tych hostach korzystam z dwóch maszyn wirtualnych z systemem Windows Server 2008 R2 Web Edition z dodatkiem SP1. Mój serwer pamięci to Windows Storage Server 2008 podłączony przez iSCSI. Zarówno hosty, jak i serwer pamięci działają z najnowszymi sterownikami sieciowymi pobranymi bezpośrednio ze strony Intela.
Oto problem: 99,99% czasu, wszystko działa idealnie. Mniej więcej raz na dwa - trzy tygodnie maszyny wirtualne jednocześnie tracą połączenie sieciowe, zarówno przychodzące, jak i wychodzące. Kiedy to się stanie,
- Nie mogę RDP na żadnej maszynie wirtualnej.
- Mogę RDP na dowolnym hoście.
- Mogę połączyć się z dowolną maszyną wirtualną z Menedżera klastra pracy awaryjnej, klikając prawym przyciskiem myszy węzeł i wybierając opcję „Połącz z maszyną wirtualną”
- Po połączeniu się z maszyną wirtualną w sposób opisany w punkcie 3 powyżej nie mogę uzyskać dostępu do żadnych witryn ani maszyn w sieci LAN. Wyłączenie i ponowne włączenie wirtualnego połączenia sieciowego w maszynie wirtualnej nie rozwiązuje problemu.
- Jeśli przeniosę maszynę wirtualną do innego węzła, rozwiąże to problem (na następne dwa tygodnie).
- Jeśli zrestartuję hosta i przeniosę na niego maszynę wirtualną, to rozwiąże problem (przez następne dwa tygodnie).
- W takim przypadku klaster pracy awaryjnej NIE automatycznie przełącza maszyny wirtualnej w tryb failover.
- Na żadnym z hostów lub maszyn wirtualnych nie ma nietypowych wpisów w dzienniku zdarzeń.
Stało się to około 5 razy z tymi samymi objawami, jak opisano powyżej. Podejrzewam problem ze sterownikiem sieciowym lub sprzętem sieciowym, ale ponieważ już korzystam z najnowszych sterowników, nie jestem pewien, co z tym zrobić.
To prawdziwy drapak w głowie ... jakieś pomysły?
Aktualizacja
Znalazłem tutaj bardzo podobny przypadek: Virutal Machine traci łączność sieciową w klastrze Hyper V.
Aktualizacja 29.07.2011
Po zainstalowaniu poprawek i aktualizacji sterowników sieciowych wciąż mam ten sam problem. W odpowiedzi na komentarz z pytaniem o szczegóły sprzętowe, serwer to Intel SR1670HV, który jest obudową 1U zawierającą dwie niezależne płyty główne S5500HV. Komunikacja odbywa się za pośrednictwem zintegrowanych kart sieciowych na płytach głównych, którymi są Intel 82574L. Sterownik sieciowy to wersja 16.2.49.0.