Robię dużo pracy konsultingowej VMware i powiedziałbym, że odsetek ten jest bliższy 80% zainstalowanej podstawowej pamięci współdzielonej o wysokiej dostępności (FC, iSCSI lub wysokiej klasy NAS), a wielu moich klientów to MŚP. Kluczowym czynnikiem, który znalazłem, jest to, czy firma traktuje czas działania serwera jako krytyczny, czy nie, dla większości dzisiejszych firm.
Z pewnością możesz uruchomić bardzo wydajne maszyny wirtualne z bezpośrednio podłączonej pamięci masowej (HP DL380 G6 z 16 dyskami wewnętrznymi w macierzy RAID 10 miałby dość szybkie operacje we / wy dysku), ale jeśli budujesz VMware lub inne zwirtualizowane środowisko, aby zastąpić dziesiątki, setki lub tysiące serwerów, jesteś szalony, jeśli nie wkładasz dużo wysiłku (i prawdopodobnie pieniędzy) w solidną architekturę pamięci masowej.
Nie musisz kupować wysokiej klasy sieci SAN dla funkcji klastrowania - możesz je zaimplementować za pomocą dość taniego serwera NAS (lub zwirtualizowanej sieci SAN, takiej jak VSA HP \ Lefthand) i nadal korzystać z certyfikowanej pamięci masowej. Jeśli jednak korzystasz z pamięci współdzielonej i nie ma ona nadmiarowości we wszystkich punktach infrastruktury SAN \ NAS, to nie powinieneś używać jej więcej niż do testowania. Nadmiarowość to (co najmniej) podwójne (niezależne) karty HBA \ NIC pamięci masowej na serwerach, podwójne niezależne sieci, nadmiarowe kontrolery w sieci SAN, pamięć podręczna podtrzymywana bateryjnie \ destrukcja pamięci podręcznej, nadmiarowe wentylatory wymienialne podczas pracy i zasilacze itp., RAID 5 \ 6 \ 10 \ 50 i odpowiednią liczbę części zamiennych.
Rzeczywista różnica między Twoimi systemami polega na tym, że jeśli jeden z autonomicznych systemów ulegnie katastrofalnej awarii, musisz wiele pracy zrobić, aby go odzyskać, i będziesz musiał przestać go utrzymywać. W przypadku klastrowych systemów podłączonych do sieci SAN łatanie hiperwizorów, a nawet modernizacja sprzętu hiperwizora powinno skutkować zerowym przestojem. Katastrofalna awaria serwera po prostu obniża czas usługi do ponownego uruchomienia maszyny wirtualnej na oddzielnym węźle (w najgorszym przypadku) lub jeśli tolerancja błędów obejmuje te maszyny wirtualne, nie ma w ogóle przestoju.