Zarządzanie pamięcią VMware wydaje się być trudnym zadaniem równoważącym. Dzięki pamięci RAM w klastrze, pulom zasobów, technikom zarządzania VMware (TPS, balonowaniu, zamianie hosta), wykorzystaniu RAM gościa, zamianie, rezerwacji, udziałów i limitów istnieje wiele zmiennych.
Jestem w sytuacji, gdy klienci używają dedykowanych zasobów klastra vSphere. Jednak konfigurują maszyny wirtualne, jakby były na sprzęcie fizycznym. To z kolei oznacza, że standardowa kompilacja VM może mieć 4 vCPU i 16 GB lub więcej pamięci RAM. Pochodzę ze szkoły rozpoczynania od małej (1 vCPU, minimalna pamięć RAM), sprawdzania rzeczywistego użycia i dostosowywania w razie potrzeby. Niestety, wiele wymagań dostawców i osoby niezaznajomione z wirtualizacją wymagają więcej zasobów niż to konieczne ... Jestem zainteresowany oszacowaniem wpływu tej decyzji.
Kilka przykładów z klastra „problemowego”.
Podsumowanie puli zasobów - wygląda na zbyt zawyżoną 4: 1. Zwróć uwagę na dużą ilość balonowej pamięci RAM.
Alokacja zasobów - kolumna Alokacja najgorszego przypadku pokazuje, że te maszyny wirtualne miałyby dostęp do mniej niż 50% skonfigurowanej pamięci RAM w ograniczonych warunkach.
Wykres wykorzystania pamięci w czasie rzeczywistym dla największej maszyny wirtualnej z powyższej listy. 4 przydzielone vCPU i 64 GB pamięci RAM. Średnio używa poniżej 9 GB.
Podsumowanie tej samej maszyny wirtualnej
Jakie są wady nadmiernego zaangażowania i nadmiernej konfiguracji zasobów (szczególnie pamięci RAM) w środowiskach vSphere?
Zakładając, że maszyny wirtualne mogą pracować w mniej pamięci RAM, jest to sprawiedliwe, by powiedzieć, że tam na górze do konfiguracji maszyn wirtualnych z większą ilością pamięci RAM niż rzeczywiście potrzebne?
Jaki jest kontrargument: „jeśli maszyna wirtualna ma przydzielone 16 GB pamięci RAM, ale używa tylko 4 GB, jaki jest problem? ”? Np. Czy należy informować klientów, że maszyny wirtualne nie są tym samym co sprzęt fizyczny?
Jakie konkretne metryki należy zastosować do pomiaru zużycia pamięci RAM. Śledzenie szczytów „Aktywności” w funkcji czasu? Oglądasz „Zużyty”?
Aktualizacja: Użyłem vCenter Operations Manager do profilowania tego środowiska i uzyskania szczegółowych informacji na temat statystyk klastra wymienionych powyżej. Podczas gdy rzeczy są zdecydowanie nadmiernie zaangażowane, maszyny wirtualne są tak nadmiernie skonfigurowane z niepotrzebną pamięcią RAM, że rzeczywisty (mały) ślad pamięci nie wykazuje rywalizacji o pamięć na poziomie klastra / hosta ...
Moja na wynos jest to, że maszyny wirtualne powinny być naprawdę odpowiedniej wielkości z odrobiną bufora do buforowania na poziomie systemu operacyjnego. Nadmierne zaangażowanie z powodu ignorancji lub „wymagań” dostawcy prowadzi do przedstawionej tutaj sytuacji. Balonowanie pamięci wydaje się być złe w każdym przypadku, ponieważ ma to wpływ na wydajność, więc dobranie odpowiedniego rozmiaru może temu zapobiec.
Aktualizacja 2: Niektóre z tych maszyn wirtualnych zaczynają się zawieszać z:
kernel:BUG: soft lockup - CPU#1 stuck for 71s!
VMware opisuje to jako przejaw nadmiernego zaangażowania pamięci . Myślę, że to odpowiada na pytanie.
Raport „Ponadwymiarowych maszyn wirtualnych” vCops ...
Wykres „Reclaimable Waste” vCops ...