Java 응용 프로그램 (log4j)에서 큰 소음이 많은 로그 파일 (500m / day)을 모니터링해야합니다. 지금은 파일을 수동으로보고 grep "ERROR"등을 지정합니다. 그러나 도구가 파일에서 반복되는 패턴을 발견하고이를 세고 개별 항목의 세부 사항을 드릴 다운 할 수 있어야합니다. 그런 도구를 아는 사람이 있습니까? 텍스트 또는 웹 기반 UI가 좋을 것입니다.
Java 응용 프로그램 (log4j)에서 큰 소음이 많은 로그 파일 (500m / day)을 모니터링해야합니다. 지금은 파일을 수동으로보고 grep "ERROR"등을 지정합니다. 그러나 도구가 파일에서 반복되는 패턴을 발견하고이를 세고 개별 항목의 세부 사항을 드릴 다운 할 수 있어야합니다. 그런 도구를 아는 사람이 있습니까? 텍스트 또는 웹 기반 UI가 좋을 것입니다.
답변:
사람들이 로그 파일에 베이지안 필터링을 적용하여 흥미로운 것들 대 일상적인 로그 항목을 발견했다고 들었습니다. 그들은 스팸 필터를 사용했는데, 일상적인 흥미없는 항목은 "양호한"것으로 간주되고 특이한 항목은 "스팸"으로 간주되어 그 색을 사용하여 전환 할 수있었습니다.
그것은 나에게 기계 학습 물건과 비슷하게 들리지만 다시는 실제로 그것을 보지 못했고 맥주를 통해서만 들었습니다.
Splunk 는 이런 종류의 일에 놀라운 일을합니다. 내부적으로 모든 로그를 수집하고 뛰어난 브라우저 기반 인터페이스를 통해 빠른 검색을 수행합니다.
syslog-ng와 patterndb (위의 답변에 +1)를 살펴보면서 ELSA라는 웹 기반 도구를 발견했습니다. http://code.google.com/p/enterprise-log-search-and-archive/ . 웹 인터페이스가있는 펄의 F / OSS이며 정말 빠릅니다.
아직 시도하지는 않았지만 patterndb를 사용하여 필터링을 완료하면 ELSA를 시도합니다.
서버에서 debian / squeeze를 사용하는 경우 log2mail을 확인하십시오. http://packages.debian.org/squeeze/log2mail
Glogg는 문자열과 컬러 라인에 필터 기반을 만들거나 모든 항목을 문자열로 검색 할 수있는 로그 탐색기입니다.
패턴을 자동으로 감지하고 유사한 로그를 집계하는 SEQREL의 LogXtender를 사용해 볼 수 있습니다. 그 방법은 즉시 정규식을 작성하고 캐시 된 정규식을 사용하여 다른 로그와 일치시키는 것입니다. 추가적인 분류법 탐지로 더 세분화 될 수 있습니다. https://try.logxtender.net 에서 무료 버전을 다운로드 할 수 있습니다 .
perl.