Jeśli chodzi o twoje pytanie - tak, utracisz dostęp do wszystkich maszyn w tym fizycznym hoście. Oczywiście zależy to od tego, który komponent zawiódł. Jeśli jest to dysk - to rodzaj problemu, jeśli to płyta główna - jest o wiele łatwiejszy. Zasadniczo odzyskiwanie sprzętu jest łatwiejsze, ponieważ funkcja hypervisor jest niezależna od sprzętu. W tej chwili istnieje wiele technologii specyficznych dla dostawców, których możesz użyć, aby mieć wysoce dostępne usługi.
Pule zasobów (vmware) - NIE są w stanie agregować wielu fizycznych zasobów hosta (procesor, pamięć itp.), Jak ktoś wspomniano powyżej, więc jeśli masz 2 hosty fizyczne (powiedzmy, że 1CPU quad rdzenie bez hyperthreading - 8 GBRAM każdy) NIE będzie można tam mieć maszynę wirtualną 5vCPU-12Gb. Pule zasobów są logiczne, nie są w stanie tworzyć systemów superkomputerowych. W tej chwili jest to sposób kontrolowania wykorzystania zasobów.
Dostępność (vmware) - możliwe jest użycie technologii takich jak High Availability (HA), które pozwalają na automatyczne odzyskiwanie (na podstawie mojego doświadczenia w ciągu 1-2 minut ) wszystkich maszyn wirtualnych w klastrze automatycznie, JEŻELI korzystasz z macierzy pamięci masowej (NAS, iSCSI, FC) i przechowuj tam wszystkie pliki VM. Co więcej, HA działa tylko w przypadku awarii procesora, pamięci RAM, płyty głównej, jest oczywiste, że nie będzie działać w przypadku awarii macierzy pamięci. Aby zapobiec awariom RAID / kontrolerów, ludzie używają replikacji, dublowania jednostek LUN pamięci masowej itp.
Jeśli odzyskiwanie w ciągu 1-2 minut nie jest opcją, istnieją technologie takie jak Fault Tolerance (FT), które pozwalają osiągnąć ZERO przestojów maszyny wirtualnej w przypadku awarii poprzez przechowywanie (działającej) kopii skonfigurowanej maszyny wirtualnej w tle. Ale ta technologia ma również wiele ograniczeń - problem odporności maszyn wirtualnych z wieloma procesorami vCPU nie jest w pełni rozwiązany.
Ogólnie rzecz biorąc, każde rozwiązanie zależy od celu.