nagios 서버의 높은 부하 — nagios 서버에 대한 서비스 검사가 너무 많습니까?


9

2.0GHz Intel 프로세서, RAID10 어레이 및 400MB의 RAM으로 Ubuntu를 실행하는 nagios 서버가 있습니다. 8 개의 호스트에서 총 42 개의 서비스를 모니터링하며, 대부분은 1 분마다 5 분까지 check_http 플러그인을 사용하여 확인합니다. 최근 nagios 서버의로드는 4를 초과하여 종종 6이 넘었습니다. 서버는 또한 6 개의 호스트에 대해 매분마다 통계를 수집하여 선인장을 실행합니다.

이와 같은 하드웨어가 얼마나 많은 서비스를 처리 할 수 ​​있는지 궁금합니다. 하드웨어의 한계를 뛰어 넘어로드가 너무 높습니까? 아니면이 하드웨어가 42 개의 서비스 확인과 선인장을 처리 할 수 ​​있어야합니까? 하드웨어가 부적절하다면 RAM, 코어 또는 더 빠른 코어를 더 추가해야합니까? 다른 하드웨어 / 서비스 확인이 실행되고 있습니까?


램 사용량은 지금 서버에서 어떤 모습입니까? 또한 CPU 사용량은 어떻게됩니까? 그것이 높으면 어떤 프로세스가 그것을 막고 있습니까?
3dinfluence

문제를 해결 했습니까? 같은 문제가 발생했습니다. 로드 평균은 12입니다.
John

답변:


7

병목 현상의 위치를 ​​파악해야합니다.

http, ping 및 ssh 확인으로 400 개 이상의 호스트를 확인하는 nagios 모니터를 실행합니다. (다른 많은 수동 검사 및 nscd와 함께)

RAID10에 4 개의 SAS 디스크가있는 2xQuadCore 서버에 있습니다.

많은 rrd에 쓰는 것이 매우 비효율적이므로 IO 경합이 있다고 생각합니다.

어떤 프로세스가 리소스를 차지하고 있는지 파악해야합니다. (선인장, nagios 또는 다른 것)

IO 확인을 위해 나는 iotop을 좋아합니다. iotop 설치 (9.04 패키지는 8.04에서 작동)

그러나 그렇지 않으면 top이로드 호그를 찾는 데 도움이됩니다.

1 분에 한 번 선인장은 매우 공격적입니다. (5m 간격으로 달리기)

rrd write 경합에 대해 들어 본 한 가지 접근법은 rrd 저장소를 ramdisk / tmpfs에 두는 것입니다. (지금마다 그 다음에 영구 저장 장치로 재 동기화해야 함)

행운을 빕니다.


감사. 내가 살펴볼 게 아마도로드를 생성하는 선인장 일 것입니다 .rdrds를 tmpfs로 이동할 수있는 방법이 있는지 살펴 보겠습니다. 또는 서버가 rrd를 버퍼링 할 수 있도록 RAM을 추가하십시오. 내가 매 5 분마다 선인장을 운영한다면, 1 ~ 2 분 동안 지속되는로드 스파이크가있을 수 있다고 생각합니다.
Josh

6

그것이 대부분의 부하를 생성하는 선인장이 아니라면 하드웨어보다 더 많은 검사를 실행할 수 있어야합니다.

나는 개가 느린 오래된 PC (느린 PATA 디스크가있는 Pentium 3 1GHz)의 Microsoft Virtual Server에서 실행되는 FreeBSD 가상 머신에서 nagios를 실행하고 있습니다. 가상 머신에는 128MB RAM 만 있으며 성능이 매우 떨어집니다.

그러나로드 평균은 약 0.2이며 42 개의 호스트에서 158 개의 검사를 실행합니다.


감사. 두 가지 답변을 모두 받아 들일 수 있기를 바랍니다! 당신은 매우 도움이되었습니다. 선인장은 아마도 범인 일 것입니다.
Josh

2

256MB의 RAM이있는 오래된 PIII에서 약 230 개의 다른 서비스를 적극적으로 모니터링하고 있습니다. 같은 기계에서도 모든 수신 팩스에 대해 MRTG와 HylaFAX를 실행하고 있으며 매우 편안합니다.


매우 유용한 정보. 이것은 선인장이 아마도 나 지오가 아니라 범인 일 것임을 나에게 나타냅니다. 감사!
Josh

1

해당 하드웨어로 nagios 검사 보트를 실행할 수 있어야합니다. 우리는 약 70 개의 검사와 Nagiosgraph로 비슷한 설정을 실행합니다. 주된 차이점은 RAM이 추가되어 있다는 것입니다 (싸기 때문에 상자를 2Gb로 올릴 것입니다).

top 또는 ps -aux를 실행하여 CPU가 오버로드되었는지 확인하지만 의심합니다. 설치가 직렬화하지 않고 한 번에 너무 많은 검사를 실행하려고하는지 확인하기 위해 nagios 병렬화 문서 를 확인할 수도 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.