Chociaż jest to stary post, odpowiadam teraz, ponieważ wiedziałem, że wartości progowe check_load przysparzają początkującym ból głowy;)
Ostrzeżenie ostrzegawcze, jeśli procesor wynosi 70% przez 5 minut, 60% przez 10 minut, 50% przez 15 minut. Alarm krytyczny, jeśli procesor wynosi 90% przez 5 minut, 80% przez 10 minut, 70% przez 15 minut.
*command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7*
Wszystkie moje ustalenia dotyczące obciążenia procesora:
Co oznacza „ładunek”: Wikipedia mówi:
Wszystkie systemy uniksowe i podobne do systemu uniksowego generują metrykę trzech „średnich obciążeń” w jądrze. Użytkownicy mogą łatwo zapytać o bieżący wynik z powłoki Unix, uruchamiając polecenie uptime:
$ uptime
14:34:03 up 10:43, 4 users, load average: 0.06, 0.11, 0.09
Z powyższej średniej obciążenia wyjściowego: 0.06, 0.11, 0.09
oznacza (w systemie jednoprocesorowym):
- w ostatniej chwili procesor był niedociążony o 6%
- w ciągu ostatnich 5 minut procesor był niedociążony 11%
- w ciągu ostatnich 15 minut procesor był niedociążony 9%
.
$ uptime
14:34:03 up 10:43, 4 users, load average: 1.73, 0.50, 7.98
Powyżej średniej obciążenia 1.73 0.50 7.98
w systemie jednoprocesorowym jako:
- w ostatniej chwili procesor był przeciążony o 73% (1 procesor z 1,73 uruchomionymi procesami, więc 0,73 procesów musiał czekać na turę)
- w ciągu ostatnich 5 minut procesor był niedociążony 50% (żadne procesy nie musiały czekać na kolej)
- w ciągu ostatnich 15 minut procesor był przeciążony 698% (1 procesor z 7,98 uruchomionymi procesami, więc 6,98 procesów musiało czekać na turę)
Obliczanie wartości progowej Nagios:
W przypadku konfiguracji obciążenia procesora Nagios, która obejmuje ostrzeżenie i krytyczne:
y = c * p / 100
Gdzie:
y = nagios value
c = number of cores
p = wanted load procent
dla systemu 4-rdzeniowego:
time 5 min 10 min 15 min
warning: 90% 70% 50%
critical: 100% 80% 60%
command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4
W przypadku systemu z jednym rdzeniem:
y = p / 100
Gdzie:
y = nagios value
p = wanted load procent
time 5 min 10 min 15 min
warning: 70% 60% 50%
critical: 90% 80% 70%
command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7
Świetna biała księga na temat analizy obciążenia procesora autorstwa dr Gunthera http://www.teamquest.com/pdfs/whitepaper/ldavg1.pdf
W tym artykule online dr Gunther zagłębia się w jądro systemu UNIX, aby dowiedzieć się, w jaki sposób średnie obciążenia ( „LA Triplets”) są obliczane i jak odpowiednie są jako wskaźniki planowania zdolności.
standard
lubtested
wartość. To zależy od oczekiwanego obciążenia serwera. Jeśli spodziewasz się dużego obciążenia, powinieneś zwiększyć wartości. W przeciwnym razie serwer będzie zawsze pojawiał się w stanie krytycznym.