나지 오스 그래프 솔루션 vs Munin / Cacti / Ganglia


9

~ 30 대의 Windows 서버를 모니터링하기위한 nagios 서버 설정이 있습니다. 트렌드 차트를 추가하고 싶습니다. 나는 nagios 그래프 플러그인이 간단 하고 많은 사람들이 별도의 독립형 차트 / 추세 도구를 사용 한다는 것을 읽었습니다 .

Nagios 그래픽 플러그인과 ganglia / munin / cacti와 같은 독립형 제품의 제한 사항은 무엇입니까?

독립형 패키지가 제공하고 nagios 그래프 플러그인이 제공하지 않는 특정 기능 및 장점에 관심이 있습니다.


Zabbix도 고려해야합니다 ... serverfault.com/q/109595/2039
sebthebert

nagios를 기반으로 opsview 커뮤니티 에디션을 사용해보십시오. 다른 Linux 버전으로 설치하거나 VM을 다운로드 할 수 있습니다. opsview.com/downloads/download-opsview-community
Matias Dominoni 2012

기록을 위해 : 나는 nagiosgraph를 시도한 다음 그것을 고수했다. 나는 그것이 제공하는 것에 매우 만족합니다
sumek

답변:


7

이미 nagios 설치가있는 경우 nagiosgraph 또는 pnp4nagios를 고려하십시오.

nagiosgraph와 pnp4nagios는 nagios 성능 데이터를 작성하는 작업을 훌륭하게 수행합니다. nagiosgraph에는 구성에 대한 매개 변수 기반 접근 방식이 있으며 pnp4nagios에는 템플릿 기반 접근 방식이 있습니다.

  • nagios 구성이 변경 될 때마다 새 호스트 / 서비스를 자동으로 감지
  • 둘 다 그래프 확대 / 축소
  • 둘 다 특정 호스트 / 서비스를 마우스로 가리킬 때 그래프를 제공합니다
  • 둘 다 데이터를 슬라이스하고 주사위를 깍는 많은 방법을 제공합니다
  • nagios에서 이미 정의한 위험 및 경고 수준을 감지하고 그래프로 표시
  • 둘 다 nagios 프레임에 직접 임베드하여 현재 상태에서 히스토리 및 역으로 매끄럽고 끊김없이 탐색 할 수 있습니다.

데이터를 슬라이싱하고 다이 싱하는 것은 매우 중요합니다. 예를 들어 단일 호스트의 모든 서비스를 보거나 특정 서비스가있는 모든 호스트를 보거나 임의의 호스트 및 서비스에 대한 임의의 그래프 모음을 볼 수 있습니다.

설치는 사소한 것이 아니지만 어렵지 않습니다. 많은 것은 당신이 물건을 커스터마이즈하려는 정도에 달려 있습니다. 예를 들어 nagiosgraph는 'install.pl'또는 'rpm -i nagiosgraph.rpm'또는 'dpkg -i nagiosgraph.deb'입니다. pnp4nagios는 './configure; 하다; 설치하십시오.

n2rrd는 이러한 작업 중 일부도 수행 할 수 있지만, 세련되지 않고 구성하는 데 더 많은 작업이 필요합니다.

rrdtool에는 wrt 데이터 스토리지에 문제가 있으며 모든 시스템에는 샘플링 문제가 있습니다. rrdtool은 기본적으로 일부 데이터 스무딩을 수행하지만 필요한 경우 평균 외에 최대 값 및 / 또는 최소값을 캡처 (및 그래프) 할 수 있습니다.

각 rrd 파일의 스키마는 정적이며 대부분의 시스템은 rrd 파일 이름을 사용하여 데이터를 식별하므로 모든 rrdtool 기반 접근 방식에서는 데이터 / 그래프가 오래되지 않습니다. 호스트 이름이나 서비스 이름이 변경 될 때 데이터는 손실되지 않습니다. rrd 파일은 여전히 ​​디스크에 존재합니다. 그러나 일부 사용자 인터페이스는 'stale'rrd 파일을 보는 방법을 제공하고 다른 사용자 인터페이스는 명령 줄을 통한 수동 하우스 키핑이 필요합니다. 많은 설치에서 이것은 시스템을 처음 구성 할 때만 문제가되지만 동적 환경 (예 : 수명이 몇 개월에 불과한 가상 시스템 모니터링)에서는 지루할 수 있습니다.

마지막 메모. 트 렌딩에는 실제로 데이터 수집과 데이터 표시의 두 부분이 있습니다. 기존 nagios 설치를 확장하지 않고 독립형 그래프 시스템을 사용하는 경우 데이터를 수집하기 위해 Windows 시스템에 추가 구성 요소를 설치해야 할 수도 있습니다.


13

나는 살 lyn 이와 동의합니다. NAGIOS는 즉각적인 정 성적 데이터를위한 것입니다 (X는 괜찮습니까? munin은 과거의 정량적 데이터를위한 것입니다 (X는 현재 얼마나 꽉 차고 올해는 얼마나 꽉 찼습니까?). 수백 개의 서비스를 모니터링하는 모든 NAGIOS 설치는 munin 시스템에 연결되어 정량 모니터링을 수행합니다.

또한 munin에는 NAGIOS에 데이터를 공급하기위한 특정 후크가 있습니다. 경고 및 위험 임계 값의 개념을 이해하고 알림 (및 NAGIOS "빅 보드"에 대한보기)이 필요한 경우 단일 munin 변수가 단일 NAGIOS 서비스의 상태를 알리는 것이 매우 쉽습니다.

일반적인 워크 플로는 NAGIOS가 임계 값이 초과되었다는 경고가 나올 때까지 아무도 munin 그래프를 보지 못하지만, munin 그래프는 시간이 지남에 따라 천천히 증가하고 있는지 또는 그렇지 않은지 알아내는 데 매우 중요합니다. -파란색 증가, 또는 우리는 매주 위 / 아래 사이클이 천천히 진폭이 증가하고 있습니다.

lynxman이 말했듯이 UNIX 방식은 "하나의 작업, 하나의 도구"입니다. munin과 NAGIOS의 툴체인을 만드는 것은 알림뿐만 아니라 양적 및 질적 모니터링을 제공하는 데 매우 효과적입니다. 또한 인터페이스를 깨끗하게 유지하는 뚜렷한 이점이 있습니다. NAGIOS를 살펴보면 과거의 데이터가보기를 어지럽히 지 않고 현재 상황이 얼마나 잘 작동하는지에 대한 간단한보기를 볼 수 있습니다. munin을 살펴보면 "호스트가 다운되었습니다"또는 "sshd가 말을하지 않습니다"오류없이 분석 할 준비가 된 문제와 관련된 기록 정보가 표시됩니다.


3

Nagios 그래프 플러그인은 매우 제한적이며 매우 기본적인 rrdtool 인터페이스를 제공하며 UI 디자인은 직관적이지 않습니다. 기본적으로 nagios를 해킹하고 재미를 위해 사용하려고 시도했지만 경고없이 여러 번 중단했습니다.

독립형 제품 (특히 munin 또는 ganglia)을 사용하면 nagios가 달성 할 수없는 광범위한 서비스를 제공합니다. 유닉스 만트라는 많은 것을 잘하려고하는 것보다 한 가지만 잘하는 것이 낫기 때문에 nagios는 훌륭합니다. 모니터링과 munin / ganglia / cacti는 그래프에 놀랍습니다.


그래서이 안에는 nagios가 달성 할 수없는 광범위한 서비스가 무엇입니까? 이것이 내가 관심있는 분야입니다.
sumek

nagios를 사용하면 그래프 데이터를 잃기 매우 쉽습니다. 플러그인이 특정 시간에 데이터 그래프를 중지하는 것도 매우 쉽습니다. 다른 시간과 달리 특정 시간으로 확대 할 가능성이 없습니다. 복잡한 집계 그래프를 수행 할 수있는 가능성을 제공하지 않으며, 이는 단지 초보자를위한 것입니다.)
lynxman

그래프 데이터를 쉽게 풀면 무엇을 의미 합니까? 빠른 구글은 언급 된 5 가지 솔루션 (ganglia, munin, cacti, pnpgraph, nagiosgraph)이 rrdtool을 사용하여 그래프 데이터를 저장한다는 것을 보여줍니다.
sumek

예, sumek, 내가 말하는 것은 다시 nagios의 그래프 도구는 해킹이며 rrd 파일 이름과 그래프 정보가 일치하지 않을 때마다 깨질 것입니다. 원한다면 시도하면 고통을 겪습니다. 다음 munin 같은 실제 솔루션으로 이동 :)
lynxman

2

스택 오버플로에서는 성능 데이터를 그래프로 표시하기위한 Nagios 플러그인 인 n2rrd 를 사용 합니다. 나는 Lynxman에 동의 할 정도로 그것이 큰 해킹 감이 있다고 생각합니다.

하나:

  • n2rrd를 사용하면 nactrr와 함께 제공되는 rrd2graph.cgi 대신 Cacti가 데이터를 기반으로 그래프를 작성하도록 할 수 있습니다.
  • rrd2graph.cgi와 함께 n2rrd는 확대 / 축소를 지원합니다
  • 복잡한 집계 그래프 인 경우 기본적으로 rrd 그래프를 손으로 조작하고 원하는대로 무엇이든 할 수 있습니다.

rrd 그래프는 서버 이름에 따라 저장되므로 데이터를 잃어버린 종류의 이름을 변경하면 항상 파일 이름을 바꿀 수 있지만 심볼릭 링크가되어 데이터를 잃지 않습니다.

최근 RDP 그래프 개선을위한가지 팁 서버 오류 블로그 게시물 에 이러한 그래프의 예가 있습니다. 또한 n2rrd 페이지에는 cacti 데모와 rrd2graph가 모두 포함되어 있습니다.

결론은 Nagios 경로를 이동하는 데 기능이 하나 또는 두 개가 부족할 수 있지만 rrd 템플릿을 직접 작성하는 세부 사항으로 손을 더럽히는 데 신경 쓰지 않으면 매우 완벽하다는 것입니다. 아마도 더 많은 시간이 걸리 겠지만 rrd에 더 많은 전문 지식을 개발하도록 장려 할 것입니다.


1
* [참조되지 않은 각주 오류] : 거기에 무엇을 추가하겠습니까, kyle; 궁금한 마음은 알아야합니다!
MadHatter

0

정확한 데이터가 필요하고 rrd의 데이터 표시가 정확하지 않습니다. 정상화되었습니다! 대부분의 사용자에게는 매우 정확한 데이터를 사용하지 않기 때문에 괜찮습니다. 샘플 속도가 1 분 이상인 데이터를 사용하고 있으며, 현재 상황에 대한 정확한 설명을 제공하지 않습니다. 이것은 또한 데이터가 어딘가에 급증하면 결코 볼 수 없다는 것을 의미합니다.

이것을 고려하십시오-Gb 네트워크가 약 10MB / 초로 허밍되고 갑자기 몇 분 동안 100MB / 초의 급증이 발생한다고 가정하십시오. 또한 30 초 스파이크 인 경우 몇 분의 샘플링 속도로는 보이지 않을 수도 있습니다. 하루의 데이터를 보면 실제 값은 여러 가지 다른 요인에 따라 다르지만 '스파이크'는 15MB / 초로 만 표시 될 수 있습니다. 또한 네트워크가 마음에 들지 않을 때 행복하다고 생각할 가능성이 매우 높습니다!

더 실망스러운 것은 그래프의 물리적 너비와 x 축 범위로 표준화 된 데이터입니다. 이것이 의미하는 것은 내가 보지 못했던 스파이크입니까? 확대하면 마술처럼 나타납니다! gnuplot을 고수하겠습니다. 그래프는 그다지 아름답지는 않지만 견고하고 gnuplot은 데이터를 표시하기 전에 데이터를 수정하지 않습니다.

-표


0

pnp4nagios를 사용하면 그래프 작업에 매우 효과적입니다. 줌도 지원합니다. 구현하기가 가장 쉽지는 않지만 nagios는 없습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.