여러 시계열 데이터 세트에서 이상 감지를 구현해야합니다. 나는 전에 이것을 한 적이 없으며 조언을 기대하고있었습니다. 나는 파이썬에 매우 익숙하므로 솔루션을 구현하는 것을 선호합니다 (대부분의 코드는 내 작업의 다른 부분에 대한 파이썬입니다).
데이터 설명 : 지난 2 년 정도 전에 수집 된 월별 시계열 데이터입니다 (즉, 24-36 시간 만). 기본적으로 여러 클라이언트에 대해 매월 모니터링되는 몇 가지 메트릭이 있습니다.
time_period client metric score
01-2013 client1 metric1 100
02-2013 client1 metric1 119
01-2013 client2 metric1 50
02-2013 client2 metric2 500
...
내가 생각하는 것은 다음과 같습니다. 데이터를 데이터 프레임 (팬더)으로 가져온 다음 각 고객 / 메트릭 쌍에 대한 6 개월 평균 롤링을 계산하십시오. 현재 기간의 값이 6 개월 평균을 기준으로 일부 임계 값을 초과하면 플래그를 올리십시오. 문제는 다소 단순 해 보입니다. 나는 탄탄한 접근 방식을 취하고 싶습니다.
이 아이디어를 조금이라도 살려주는 조언은 크게 감사하겠습니다. 나는 그 질문이 약간 추상적이라는 것을 알고 있으며, 그것에 대해 사과드립니다.