보다 포괄적 인 모니터링 도구 및 기능 목록은 이 Wikipedia 페이지를 참조하십시오 .
질문에서 알 수 있듯이이 작업에 가장 일반적으로 사용되는 도구는 무엇이며 장단점은 무엇입니까?
보다 포괄적 인 모니터링 도구 및 기능 목록은 이 Wikipedia 페이지를 참조하십시오 .
질문에서 알 수 있듯이이 작업에 가장 일반적으로 사용되는 도구는 무엇이며 장단점은 무엇입니까?
답변:
나는 과거에 Nagios 를 성공적으로 사용했습니다. 확장 성이 뛰어나고 (200 개가 넘는 애드온) 비교적 사용하기 쉬우 며 많은 보고서가 있습니다. 초기 설정은 부정적인 것입니다.
Cacti 는 RRDTool의 웹 기반 프론트 엔드로 매우 편리한 그래프와 통계를 제공합니다. RRDTool 은 여러 시스템에서 데이터를 수집하고 광범위한 기술 데이터를 모니터링하는 부분입니다.
우리는 cacti / RRDTool 솔루션을 사용하여 Unix 및 Windows 시스템을 모니터링하고 있습니다. 우리는로드, CPU / RAM 사용량, HD 공간, 로그인 한 사용자, 네트워크 트래픽, 프로세스 실행 등 유용한 메트릭을 많이 얻습니다.
개인적으로, 나는 매우 간단한 아키텍처를 가지고 있기 때문에 설치 및 플러그인 작성이 매우 쉬운 Munin 을 좋아 합니다. 상상할 수있는 모든 목적을 위해 이미 많은 플러그인이 있으므로, 처음부터 플러그인을 작성하지 않아도됩니다.
또한 아름다운 그래프와 (매우 기본적인) 경고를 구성하는 옵션을 제공합니다.
Zabbix . 오픈 소스이며 설정 및 사용자 정의가 상당히 간단합니다. zabbix 서버에 공급되는 많은 사용자 정의 모니터링 스크립트가 있지만 데이터를 중앙 집중화하고 적절하게 표시하고 알림 (이메일, IM, SMS, 트위터 등)을 처리합니다.
저는 회사에서 Spiceworks 를 출시 했으며 서버 모니터링뿐만 아니라 네트워크의 다른 모든 도구를위한 훌륭한 도구라는 것을 알게되었습니다.
문제가있을 때 이메일을 보내기 위해 자동 인벤토리 및 사용자 정의 모니터링과 같은 작업을 수행합니다 (예 : 프린터가 잉크의 10 % 이하이거나이 서버의 하드 드라이브의 비율이 20 %입니다).
단점은 아마도 컴퓨터 당 정보의 밀도 일 것입니다. 컴퓨터 당 많은 데이터가 있다고 잘못하지는 않지만 많은 통계를 원할 수있는 서버와 같은 경우 다른 도구를 사용해야 할 수도 있습니다.
편집 : 오, 나는 그것의 비즈니스 모델이 영원히 무료라는 것을 기반으로 언급했다.
Smokeing 은 다양한 서버 및 서비스의 가용성을 확인할뿐만 아니라 대기 시간을 추적하면서 사용하기 쉽고보기 좋으며 그래프를 빠르게 표시 합니다.
광범위한 대기 시간 측정 플러그인을 즉시 사용할 수 있습니다. Perl을 알고 있다면, 이국적인 요구에 따라 자신 만의 것을 쉽게 만들 수 있습니다.
대규모 설치의 경우 분산 측정을 위해 마스터 / 슬레이브 시스템의 이점이 있습니다.
고도로 구성 가능한 경보 시스템은 사용자에게 영향을 미치기 시작하거나 중대한 정전으로 발전하기 전에 문제를 발견하는 데 도움이됩니다.
Smokeing은 MRTG 및 RRDtool의 제작자 인 Tobi Oetiker가 Perl로 작성한 무료 오픈 소스 소프트웨어입니다.
OpenNMS 는 수천 대가 넘는 Linux 컴퓨터를 모니터링하는 데 사용됩니다. 각 컴퓨터의 하드웨어와 컴퓨터에서 실행되는 응용 프로그램을 모니터링합니다.
Zenoss Core 는 일부 사용 중이며 서버, 네트워크 스위치 및 UPS의 경량 모니터링에 약 1 년 동안 사용하고 있습니다.
Zenoss Core는 수상 경력에 빛나는 오픈 소스 IT 모니터링 제품으로 단일 통합 소프트웨어 패키지를 통해 네트워크, 서버 및 응용 프로그램의 구성, 상태 및 성능을 효과적으로 관리합니다.
Nagios는 무료이며 많은 플러그인이 있기 때문에 훌륭합니다. 그러나 UI와 구성은 매우 어렵습니다.
무료로 제공되지는 않지만 플러그인이 적지 만 설정 및 구성이 훌륭하고 쉽다는 Microsoft SCOM (System Center Operations Manager)도 훌륭한 장점입니다.
내가 주로 Microsoft 회사에 있거나 매우 높은 의존성 요구 사항 (예 : 모니터링을 감당할 여유가 없음)이 있거나 개발자가이를 사용하게하는 것에 대해 생각해야한다면 SCOM이 Nagios에 대한 나의 추천이 될 것입니다.
나는 사용했다 :
Windows 사용자 인 MOM. SCOM (Systems Center Operations Manager)으로 업그레이드하려고하지만 Windows 2008 배포를 시작하기 전까지는 필요하지 않습니다.
운영 모니터링 업그레이드 프로젝트에 참여하고 있습니다. 우리는 몇 가지 큰 달러 시스템을 제시하기 위해 다양한 벤더가 현장에 와서 비교할 수있는 저렴한 대안을 혼합했습니다.
그 중 하나는 Hyperic 이며 무료 오픈 소스 솔루션으로도 제공됩니다. 나는 맞춤형 에이전트를 위해 제공되는 기능과 확장성에 깊은 인상을 받았습니다.
통계 (메모리 사용,로드, mysql 활동, 아파치 활동 등)를 모니터링하기 위해 Munin을 사용 합니다. 기본적으로 이미 많은 것을 추적하고 서로 다른 시간 간격 (지난 24 시간, 지난 7 일, 지난 달, 작년)에 대한 그래프를 표시합니다. 플러그인을 통해 더 많은 것을 모니터링 할 수 있습니다. 출력은 예쁜 그래프가있는 HTML 페이지입니다.
Munin에는 마스터 / 노드 아키텍처가 있습니다. 노드는 서버에서 통계를 수집하고 마스터는 데이터를 저장하고 HTML 및 그래프를 생성합니다.
Monit 을 사용 하여 실행중인 프로세스를 추적하고 특정 구성 가능한 조건 (높은 CPU로드, 높은 메모리 사용량, HTTP 응답 없음 등)이 발생할 때 다시 시작하거나 경고합니다. Monit은 또한 CPU와 같은 서버에 대한보다 일반적인 사항을 모니터링 할 수 있습니다 로드, 메모리 사용량, 하드 디스크 상태 또는 디스크 사용량.
모니터링하려는 모든 서비스 또는 하드웨어와 문제가 발생했을 때 대응하는 방법에 대해 Monit을 구성해야합니다. 가장 많이 사용되는 옵션은 아무 것도하지 않고 경고 이메일을 보내거나 서비스를 다시 시작하는 것입니다.
Monit은 작동 할 때 훌륭하지만 때로는 서비스를 시작, 중지 또는 다시 시작하지 못하며 잘못된 정보를 알려주는 진단 정보가 많지 않습니다. 즉, 문제가 서비스 또는 Monit 구성과 관련이 있는지 알 수 없으며 이는 cron과 같은 최소 환경에서 실행됩니다.
두 도구는 대부분의 Linux 배포에서 기본적으로 사용 가능합니다.
아무도 리눅스 서버에 대한 logwatch 또는 logcheck 를 언급하지 않은 것에 놀랐습니다. 로그를 읽는 데 많은 시간을 절약 할 수 있습니다 !!
우리 프로젝트는 100 개 이상의 노드 클러스터에 Ganglia 를 사용 합니다. 우리가 그것을 사용하는 한 가지 이유는 그것이 Rocks 와 함께 제공되는 모니터링 도구이기 때문 입니다 .
각 노드에서 오버 헤드가 매우 낮아 계산에 사용할 수있는 리소스를 최대한 많이 확보하는 것이 중요합니다. Ganglia는 클러스터에 대한 좋은 개요를 제공하며 필요한 경우 개별 노드로 드릴 다운 할 수 있습니다. 지금 무슨 일이 일어나고 있는지 아는 것 외에도 지난 1 시간, 1 주일, 1 주일, 1 년, 1 년, 1 년 동안 무슨 일이 있었는지 잘 볼 수 있습니다. 다양한 통계 그래프는 기본적이고 기능적입니다.
Cacti 및 RRDTool 기반 솔루션과의 경쟁을 확인하기위한 새로운 참가자는 Graphite입니다 ( http://graphite.wikidot.com/ ).
RRDTool은 Whisper라는 백업 저장소로 대체되었습니다. 문서는 왜 그것이 다른지에 대한 꽤 좋은 개요를 제공하며 무언가를 조사 할 때 임시 그래프를 만드는 CLI를 정말로 좋아합니다.
현재 Paessler의 PRTG를 사용하고 있습니다 . 훌륭합니다. 에이전트가 필요하지 않고 뛰어난 Ajax 웹 인터페이스, 히스토리 로깅, 그래프 작성, WMI 등이 있습니다. 무료로 사용할 수있는 10 개의 센서 버전이 있지만 엔터프라이즈 버전에는 몇 가지 장점이 있습니다. 돈을 잘 보냈다.
Hobbit-Big Brother의 더 빠른 버전입니다 (요즘 놀랍게도 상업적인 것으로 보입니다).
급한 시간에 MS 서버를 모니터링하는 빠른 도구를 원한다면 Windows 용 성능 모니터를 사용하고 사용자 지정 모니터링 템플릿과 사용자 지정 일정으로 카운터 로그를 설정하십시오 (예 : 매시간 5 분 동안 데이터 수집). 그런 다음 Microsoft의 LogParser 및 Codeplex의 PAL (Performance Analysis of Logs) 도구 ( http://pal.codeplex.com/ )를 다운로드하여 카운터 로그를 처리하십시오. PAL은 가능한 문제 해결 문서 / 도구에 대한 링크가 포함 된 훌륭한 문서화 된 보고서를 생성합니다.
Solarwinds, VMware 서버 성능 탭 및 사용자 지정 스크립트의 조합을 사용합니다.
Solarwinds Orion 네트워크 성능 모니터는 Windows 시스템에서 사용하는 것입니다. 내 웹 서버의 관리자. 여전히 유용한 앱 메트릭스가 실행되고 있지만 기본 상자 수준 항목 (디스크, 네트워크, CPU)에 대한 좋은 정보가 있습니다.
VMware 게스트에게는 성능 탭이 마음에 듭니다.
Sun 서버의 경우, Solarwinds에서 사용할 수없는 항목이 필요할 때 (관리자가 추가하지 않았거나 무엇 때문에) 미러 상태, 스왑 사용량 등과 같은 항목을 모니터링하기 위해 사용자 지정 스크립트 (일반적으로 Perl)를 작성합니다.
Solarwinds에 대해 더 많이 알고 싶지만 하루에 26 시간 밖에 걸리지 않아 상사가 믿는다는 것은 약간의 제한이 될 수 있습니다.
Zabbix ( http://www.zabbix.com )도 Nagios보다 좋고 설정하기 쉽습니다.
우리는 우리 자신의 모니터링 소프트웨어를 작성했습니다. 우리 코드는 상용 패키지만큼 정교하지는 않지만 많은 기능이 필요하지 않았습니다. 다른 패키지를 조사하고 사용 방법을 배우는 것보다 직접 작성하는 것이 더 쉬웠습니다. 코드는 우리가 원하는 것을 수행하고 확장하기 쉽습니다.