이전 게시물이지만 check_load 임계 값이 초보자에게는 큰 골치 거리라는 것을 알았으므로 지금 답장하십시오 ..;)
CPU가 5 분 동안 70 %, 10 분 동안 60 %, 15 분 동안 50 % 인 경우 경고 경고. CPU가 5 분 동안 90 %, 10 분 동안 80 %, 15 분 동안 70 % 인 경우 중요한 경고입니다.
*command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7*
CPU로드에 대한 나의 모든 발견 :
"로드"의 의미 : Wikipedia의 말 :
모든 유닉스 및 유닉스 계열 시스템은 커널에서 3 개의 "부하 평균"숫자 메트릭을 생성합니다. uptime 명령을 실행하여 Unix 쉘에서 현재 결과를 쉽게 쿼리 할 수 있습니다.
$ uptime
14:34:03 up 10:43, 4 users, load average: 0.06, 0.11, 0.09
위의 출력로드 평균에서 : 평균 0.06, 0.11, 0.09
(단일 CPU 시스템에서) :
- 마지막 1 분 동안 CPU가 6 % 언더로드되었습니다.
- 지난 5 분 동안 CPU에 11 %의 부하가 걸렸습니다.
- 지난 15 분 동안 CPU에 9 %의 부하가 걸렸습니다.
.
$ uptime
14:34:03 up 10:43, 4 users, load average: 1.73, 0.50, 7.98
1.73 0.50 7.98
단일 CPU 시스템에서 위의로드 평균은 다음과 같습니다.
- 마지막 1 분 동안 CPU가 73 % 오버로드되었습니다 (실행 가능한 1.73 개의 프로세스가있는 1 개의 CPU이므로 0.73 개의 프로세스가 차례를 기다려야했습니다)
- 지난 5 분 동안 CPU에 50 %의로드가 발생했습니다 (프로세스를 기다릴 필요가 없었습니다)
- 지난 15 분 동안 CPU에 698 %의 오버로드가 발생했습니다 (7 개의 실행 가능한 프로세스가있는 1 개의 CPU가 있으므로 6.98 프로세스는 차례를 기다려야했습니다)
Nagios 임계 값 계산 :
경고 및 위험이 포함 된 Nagios CPU로드 설정의 경우 :
y = c * p / 100
어디:
y = nagios value
c = number of cores
p = wanted load procent
4 코어 시스템의 경우 :
time 5 min 10 min 15 min
warning: 90% 70% 50%
critical: 100% 80% 60%
command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4
단일 코어 시스템의 경우 :
y = p / 100
어디:
y = nagios value
p = wanted load procent
time 5 min 10 min 15 min
warning: 70% 60% 50%
critical: 90% 80% 70%
command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7
박사 군터에 의해 CPU 부하 분석에 대한 좋은 백서 http://www.teamquest.com/pdfs/whitepaper/ldavg1.pdf
박사 군터는 UNIX 커널에 아래로 파고이 온라인 기사에서합니다 (방법로드 평균을 찾을 수 "LA Triplets")가 계산되고 용량 계획 메트릭으로 얼마나 적합한 지 계산됩니다.
standard
또는tested
가치 가 있다고 생각 합니다. 예상되는 서버 작업량에 따라 다릅니다. 높은로드를 예상하면 값을 늘려야합니다. 그렇지 않으면 서버는 항상 위험 상태로 나타납니다.