나에게서 시계열에 관한 또 다른 질문.
3 년 동안 정신 병원에서 폭력 사건을 매일 기록하는 데이터 세트가 있습니다. 이전 질문의 도움으로 나는 그것을 다루었 고 지금 그것에 대해 조금 더 행복합니다.
내가 지금 가지고있는 것은 매일 시리즈가 매우 시끄럽다는 것입니다. 그것은 0에서 최대 20까지 급격히 변동합니다. 황토 플롯과 예측 패키지 (나 같은 초보자에게 강력하게 추천 할 수 있음)를 사용하면 예측에서 엄청난 신뢰 구간으로 완전히 평평한 선을 얻습니다.
그러나 매주 또는 매월 데이터를 집계하는 것이 훨씬 더 합리적입니다. 그들은 시리즈의 시작에서 아래로 휩쓸린 다음 중간에 다시 증가합니다. 황토 플로팅과 예측 패키지는 훨씬 더 의미있는 것을 만들어냅니다.
그래도 속임수처럼 느껴집니다. 나는 집계 된 버전을 선호합니까? 실제로 유효하지 않아 멋지게 보이기 때문입니까?
아니면 이동 평균을 계산하여 기준으로 사용하는 것이 더 좋을까요? 받아 들일 수있는 것이 무엇인지 확신 할 수있을만큼이 모든 이론을 이해하지 못합니다.