Używam testowania Debiana bez żadnych problemów przez ~ 6 lat (tylko regularnie go aktualizuję), ale ostatnio zaczęło wykazywać losowe zachowanie, które można streścić jako „Niska wydajność I / O, która utrzymuje się aż do ponownego uruchomienia”.
Problem polega na tym, że nagle wszystkie dyski odczytują i zapisują zwalniają do ~ 5 MB / s, co powoduje ciągły odczyt i zapis. Ponieważ szybkość jest tak niska, dyski nie są obciążane mechanicznie ani obciążane, ale wszystko zwalnia aż do ponownego uruchomienia.
Podsystem we / wy komputera składa się z jednego dysku SSD OCZ Vertex 3 i dwóch dysków twardych WD Caviar Black. Dysk SSD przechowuje część systemu operacyjnego obciążoną do odczytu, a partycja na dysku twardym przechowuje resztę.
Aby zdiagnozować problem, próbowałem bezskutecznie:
top
nie wykazuje żadnej niekontrolowanej aktywności ani w procesorze, ani we / wy.hdparm
zwraca normalne oceny wydajności dysków (ja tylko sprawdziłem-t
).smartctl
nie wykazuje żadnych problemów z wydajnością dysków. Długie testy wykazały, że dyski są jak nowe.
System ma chipset Z77, 16 GB pamięci RAM i procesor Intel i7 3770K, a statystyki nie wykazują żadnych oznak nasycenia w pamięci RAM, we / wy lub procesorze, ale nie mam doświadczenia z debugowaniem takich problemów (szczególnie w przestrzeni jądra). Każda pomoc będzie mile widziana.
Aktualizacja 1:
- Jako środek ostrożności uruchomiłem (wymuszony) fsck na każdej partycji. Wszystkie FS są czyste.
- Nawiasem mówiąc, znalazłem aktualizację systemu BIOS, która wyszła miesiąc temu i zastosowałem ją.
- Żadna partycja nie jest wypełniona więcej niż 50%.
Aktualizacja 2:
Problem nie pojawia się na dwa dni. Albo fsck
aktualizacja systemu BIOS usunęła niektóre zatory w systemie. Nadal monitoruję problem i zamknę pytanie z odpowiedzią pośmiertną.
Aktualizacja 3:
Problem właśnie się pojawił i zacząłem trochę kopać. Proszę zobaczyć odpowiedź.
noop
.
free
)
iowait
itp., Jeśli zbierasz dane sar. Włączę, sysstat
jeśli jeszcze nie działa. Możesz sprawdzić na sar -A
większości platform z dziesięciominutowymi interwałami próbkowania.
atop
może wskazywać, jak zajęte są dyski (na przykład podczas wyszukiwania przez cały czas).