munin을 설치하면 기본 플러그인 세트가 활성화됩니다 (적어도 우분투에서). 또는 munin-node-configure
시스템에서 지원되는 플러그인을 파악하기 위해 간단히 실행할 수 있습니다. 이 플러그인의 대부분은 간단한 데이터를 보여줍니다. 내 질문은 하지 데이터 (음 ... 어쩌면 일부)의 성격을 설명하지만,하는 무엇을 당신이이 그래프에서 찾는 것입니다?
munin을 쉽게 설치하고 멋진 그래프를 볼 수 있습니다. 그러나 그래프를 가지고 있고 "읽을"능력이 없으면 완전히 쓸모가 없게됩니다.
시스템에서 기본적으로 활성화 된 표준 플러그인을 나열하겠습니다. 그래서 그것은 긴 목록이 될 것입니다. 완성도를 높이기 위해 내가 생각하는 플러그인을 나열하고 사용 용도에 대해 간단히 설명하겠습니다. 내가 잘못하면 탄원이 맞습니다.
이 질문을 세 부분으로 나누겠습니다.
- 내가 데이터를 이해하지 못하는 플러그인
- 데이터를 이해하지만 알아 두어야 할 것을 모르는 플러그인
- 내가 생각하는 플러그인
내가 데이터를 이해하지 못하는 플러그인
여기에는 반드시 munin만을 목표로하는 것은 아닙니다. 데이터를 이해하지 못하면 일반적으로 운영 체제 / 하드웨어에 대한 기본 지식의 차이가 발생합니다. ....;) "giyf"답변으로 자유롭게 응답하십시오.
이것들은 내가 무슨 일이 일어나고 있는지 추측 할 수있는 플러그인 입니다 ... 나는이 "추측"을보고 싶지 않습니다 ...
- 장치 당 디스크 IO (초당 IO)
IO 란 무엇입니까? 나는 그것이 입 / 출력을 의미한다는 것을 알고 있습니다. 그러나 그것은 먼 길입니다. - 장치 당 디스크 대기 시간 (평균 IO 대기)
"IO 대기"가 무엇인지 전혀 알지 못합니다 ... - IO 서비스 시간
이것은 큰 혼란이며 그래프에서 무언가를 보는 것이 거의 불가능합니다.
데이터를 이해하지만 알아 두어야 할 것을 모르는 플러그인
- IOStat (블록 / 초 읽기 / 쓰기)
여기에서주의 할 점은 스파이크입니까? 장치가 많이 사용된다는 의미는 무엇입니까? - 사용 가능한 엔트로피 (바이트)
이것이 난수 생성에 중요하다고 생각합니까? 왜 이것을 그래프로 표시합니까? 지금까지 값은 항상 일정했습니다. - VMStat (실행 / I / O 절전 프로세스)
이 프로세스와 "프로세스"그래프의 차이점은 무엇입니까? 둘 다 실행 / 절전 프로세스를 표시하는 반면 "프로세스"그래프에 자세한 내용이있는 것 같습니다. - 장치 당 디스크 처리량 (바이트 / 초 읽기 / 쓰기)
이 장치와 "IOStat"그래프의 차이점은 무엇입니까? - inode 테이블 사용법
이 그래프에서 무엇을 찾아야합니까?
내가 생각하는 플러그인
여기 몇 가지를 추측 할 것입니다 ... 내가 틀렸다면 나를 바로 잡으십시오.
- 디스크 사용량 (백분율)
사용 / 잔여 디스크 공간. 이 수치가 100 %에 가까워지면 파티션 정리 또는 확장을 고려해야합니다. 이것은 루트 파티션에 매우 중요합니다. - 방화벽 처리량 (패킷 / 초)
방화벽을 통과하는 패킷 수입니다. 이것이 오랫동안 스파이크 인 경우 DOS 공격의 징후 일 수 있습니다 (또는 우리는 단순히 큰 파일을 수신하고 있습니다). 방화벽 성능에 대한 아이디어를 제공 할 수도 있습니다. 수평을 맞추고 더 많은 "전력"이 필요한 경우로드 밸런싱을 고려해야합니다. 수평을 맞추고 CPU로드와 상관 관계가있는 경우 하드웨어가 충분히 빠르지 않을 수도 있습니다. 디스크 사용량과의 상관 관계는 FW 구성에서 과도한 LOG 대상을 가리킬 수 있습니다. - eth0 오류 (패킷 입 / 출력)
네트워크 오류. 이 값이 증가하면 하드웨어 결함 일 수 있습니다. - eth0 트래픽 (비트 / 초 입출력)
원시 네트워크 트래픽. 방화벽 처리량과 관련이 있어야합니다. - 스레드 수
계속 증가하는 값은 스레드를 올바르게 닫지 않는 프로세스를 가리킬 수 있습니다. 조사하다! - 프로세스
활성 프로세스의 분석 (수면 포함). 여기에서 빠른 스파이크는 포크 폭탄을 가리킬 수 있습니다. 느리지 만 계속 증가하는 값은 응용 프로그램이 하위 프로세스를 생성하지만 하위 프로세스를 올바르게 닫지 않음을 나타낼 수 있습니다. 을 사용하여 조사하십시오ps faux
. - 프로세스 우선 순위 프로세스 우선 순위
의 분포를 보여줍니다. 우선 순위가 높은 프로세스 만 사용하는 것은별로 유용하지 않습니다. 우선 순위를 낮추는 것을 고려하십시오. - CPU 사용량
상당히 간단합니다. 스파이크가 발생하면 공격이 진행 중이거나 프로세스가 CPU를 호그하고있는 것입니다. 정상적인 작동에서 천천히 증가하고 최대에 도달하면 하드웨어 업그레이드 (또는로드 밸런싱)를 고려해야합니다. - 파일 테이블 사용법 현재
열려있는 파일 수입니다. 최대 값에 도달하면 프로세스가 열리지 만 파일이 제대로 해제되지 않을 수 있습니다. - 로드 평균
시스템로드에 대한 요약 된 값을 표시합니다. CPU 사용량과 관련이 있어야합니다. 많은 소스에서 값이 증가 할 수 있습니다. 다른 그래프와의 상관 관계를 찾으십시오. - 메모리 사용량 메모리를
그래픽으로 표현한 것입니다. 사용하지 않은 + 캐시 + 버퍼가 많은 한 괜찮습니다. - swap in / out
스왑 파티션의 활동을 보여줍니다. 이 값은 항상 0이어야합니다.이 활동이 표시되면 시스템에 메모리를 추가해야합니다!