tło
Mieliśmy incydent, w którym klaster pracy awaryjnej systemu Windows doznał przerwy. Sekcja zwłok wykazała, że węzeł został „usunięty”, jak opisano w tym artykule .
Dopiero niedawno przeprowadziliśmy pełną migrację tego klastra do naszego środowiska VMware i wygląda na to, że opisane powyżej zdarzenie mogło być przyczyną awarii.
Powiązany artykuł VMware KB na ten temat mówi o zwiększeniu Small Rx Buffers
i Rx Ring #1
ustawieniach, ale ostrzega, że zbyt duże zwiększenie tych wartości może drastycznie zwiększyć obciążenie pamięci na hoście.
Po audycie Network Interface\Packets Received Discarded
liczników wydajności naszych ~ 150 maszyn wirtualnych z systemem Windows, 22 vNIC na 16 gości miało kilka odrzuconych pakietów.
Wystarczająco mała kwota, że nie martwię się o opodatkowanie hostów dodatkowym użyciem pamięci, ale chcę zrozumieć, w jaki sposób pamięć jest wykorzystywana dla tych ustawień i skąd ta pamięć pochodzi.
pytania
- Jaki jest związek między liczbą buforów a rozmiarem pierścienia?
- Jak obliczyć ilość pamięci używanej dla danych wartości tych ustawień?
- Ponieważ te ustawienia dotyczą samej karty sieciowej w systemie-gościu, zakładam, że są to ustawienia sterownika. To sprawia, że myślę, że używana pamięć RAM może być pulą stronicowaną lub niestronicowaną.
- Czy to jest poprawne?
- Jeśli tak, czy powinienem się tym martwić?
- Czy są jakieś obawy, których tutaj nie biorę pod uwagę?
Staramy się ustalić, czy wady tych maszyn wirtualnych są inne niż wykorzystanie pamięci hosta VMware. Jeśli na przykład zwiększamy ryzyko wyczerpania pamięci puli u gościa, jesteśmy bardziej skłonni zacząć od małego.
Niektóre (być może wszystkie) z tych pytań mogą nie być specyficzne dla VMware lub wirtualizacji.