프로덕션 서버 모니터링 [닫기]


18

OpenVZ를 사용하여 여러 VPS로 분할 된 3 개의 전용 서버가 있습니다. 우리는 munin을 사용하여 프로덕션 사이트에서 VPS를 모니터링하고 VPS 중 일부를 모니터링하여 실패시 서비스를 다시 시작하는지 확인합니다.

최대 14 개의 VPS를 보유하고 있으므로 munin이 수집 한 데이터뿐만 아니라 추가 통계를 볼 수있는 센터 허브가 필요합니다. 서비스의 네트워크 및 성능에 대해

우리의 요구 사항 중 일부 :
-실패에 대한 SMS 알림 (특정 사용자 정의 확인을 설정하는 기능)
-아파치 error_log 및 기타에 대한 로그 분석기.
-중앙에 있어야합니다 (데이터를 수집하는 하나의 서버와 여러 노드를 의미 함).
-설치가 쉽지만 유지 관리가 간편 할 필요는 없습니다.
-자유로 워야한다

나는 nagios와 splunk를 지적했다, 당신은 어떻게 생각하십니까? 감사,

답변:


17

Xen을 제외하고 비슷한 설정이 있습니다. 나는 다음의 조합에 매우 만족했습니다.

  • 경고 용 Nagios (일부 라이트 그래프에는 PNP 사용, 서비스 상태 대시 보드에는 Nagviz)
  • 시스템의 과거 그래프 작성을위한 Ganglia
  • HIDS로서의 OSSEC 및 마찬가지로 중앙 로깅을위한 수집기로서 중요
    • (!) 참고 : 통합하고이 두 가지 도구가 OSSEC에 대한 인 Splunk 플러그인이 아주 잘, 나는 비록 인 Splunk의 V4에 포트를 통해 그들을 기다리고있다가.
  • Splunk 마지막으로 Splunk 플러그인 중 일부를 마이그레이션 한 후에는 로그를 사전 필터링하여 Splunk를 사용하여 무료 버전 제한을 넘지 않도록 계획합니다.

모니터링 설정을 공유하면 도움이되기를 바랍니다. :-)

유용한 링크는 다음과 같습니다.

http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html

https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/

http://www.ossec.net/main/splunk-ossec-integration

최신 정보:

나는 우리가 Matt Simmons Nagios 구성 레이아웃도 사용한다는 것을 잊어 버렸습니다 .http : //www.standalone-sysadmin.com/blog/2009/07/nagios-config/

이 레이아웃 덕분에 Nagios Configuration이 깔끔하고 유지 관리가 훨씬 쉬워졌습니다 (매트 감사합니다!)


2
OSSEC + splunk의 경우 +1 그들은 함께 잘 작동합니다.
sucuri

5

Zabbix로 큰 성공을 거두었습니다 . 하나의 패키지로 모든 포인트를 충족시킵니다.

대체 텍스트
(출처 : zabbix.com )

가장 어려운 부분은 아파치 로그 모니터링을 얻는 것이지만 Zabbix는 확장 가능하므로 LogWatch 또는 다른 펄 스크립트를 사용하여 데이터를 가져올 수 있습니다.


2

나는 OpManager를 좋아하고 특정 수의 노드까지 사용할 수 있습니다. 위의 모든 작업을 수행하며 설치 및 유지 관리가 매우 쉽습니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.