큰 클러스터에서 Nagios 종속성을 관리하는 방법은 무엇입니까?


8

종속성없이 상당히 큰 nagios 구성 (약 4000 개의 서비스)을 사용하고 있습니다. 이로 인해 문제가 발생했을 때 알림이 엉망이됩니다.

Nagios Dependencies로 모범 사례를 찾으려고 노력하지만 웹에서 찾은 모든 것은 단일 예제를 통한 기본적인 이해입니다. 필요한 것은 그러한 구성 파일을 관리하는 방법에 대한 자세한 정보, 모범 사례입니다.

예 : 아파치가 각각 청취하는 100 개의 서버 클러스터에서 아파치 프로세스 수와 청취 tcp 포트 80을 모니터링하고 있습니다. 하나는 다른 것에 의존하고 싶지만 depend_hostgroup_name은 트릭을 수행하지 않습니다. 모든 "check process"서비스는 각 "check_http"서비스에 종속됩니다.

질문은 다음과 같습니다. 종속성을 어떻게 관리합니까? 스크립트를 사용하여 생성합니까?


1
이 사람은 동일한 문제가 있습니다 dimmeria.com/node/1804는 그 스크립트 / 템플릿이 유일한 방법입니다 :( 내가 할 필요가 없습니다 그래서 누군가가 내 앞에 그것을 한 희망 날 것으로 보인다.
팔켄

답변:


2

스크립팅 없이는 매우 어렵다는 것에 동의했습니다.

모든 서비스 확인 명령에 대해 (db 테이블에서) 일반적으로 의존하는 것을 정의하여 모든 서비스 종속성을 수동으로 구성하지 않아도됩니다. 호스트 종속성은 직접 수행하지만 스크립트를 통해 스위치에서 mac 주소 검색을 수행하면 자동화하는 데 도움이됩니다.

예 :

"check_http_content"는 "check_ping"에 의존하는 "check_http"에 의존합니다.
"check_cisco_ifstate"는 "check_ping"에 의존하는 "check_snmp_ok"에 의존합니다

스크립트를 사용하여 데이터베이스에서 구성을 빌드하는 경우 구현하기가 어렵지 않습니다. 그렇지 않으면 구성 파일을 통해 파서를 작성하고 규칙에 따라 종속성을 삽입하려고합니다.

구성을 구성하는 구성 데이터베이스가 없어도 규모가 큰 nagios 구현을 상상할 수 없으며 nagios가 부족할 때 자신의 추상화를 추가하고 다른 많은 방법으로 인생을 간단하게 만들 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.