Mam kilka maszyn wirtualnych na Windows Azure, które prowadzą naszą witrynę e-commerce, a ostatnio zaczęliśmy używać Telegraf, InfluxDb i Grafana do monitorowania tych maszyn. Po kilku tygodniach zbierania danych zauważyłem dziwny wzorzec związany z danymi dostępnej pamięci :
Codziennie prawie zawsze o tej samej porze dnia zauważyłem, że uwalniana jest nagła ilość pamięci, która ze względu na moje bardzo, bardzo ograniczone umiejętności DevOp, nie jest w stanie zrozumieć, co to powoduje.
Oto wykres pokazujący ten wzór:
Moje pytanie brzmi: co może prowadzić do czegoś takiego? Czuję pokusę, by podejrzewać, że to wina wycieku pamięci, ale ... Wolna pamięć nigdy nie spada poniżej 70% i zdarza się tylko na dwóch maszynach wirtualnych o największym ruchu!
Czy powinienem się martwić, gdy widzę coś takiego?
PS: Zacząłem zbierać metryki dla prywatnych bajtów wirtualnych dla każdej z uruchomionych usług Windows i dla procesu w3wp ... chociaż przeczytałem, że te metryki nie są bardzo wiarygodne, aby dowiedzieć się, czy masz przeciek pamięci, ale przynajmniej postaram się uzyskać jakiś trend i sprawdzić, czy koreluje on ze wzorem pokazanym powyżej.