이 문제는 실제로 화재 감지에 관한 것이지만 일부 방사성 붕괴 감지 문제와 매우 유사합니다. 관찰되는 현상은 산발적이며 매우 가변적입니다. 따라서 시계열은 변수 값에 의해 중단 된 긴 문자열 0으로 구성됩니다.
목적은 단순히 이벤트를 캡처하는 것 (0으로 나누기)이 아니라 이벤트 자체의 정량적 특성입니다. 그러나 센서는 제한되어 있으므로 "실제"가 0이 아닌 경우에도 0을 기록합니다. 이러한 이유로 센서를 비교할 때 0이 포함되어야합니다.
센서 B가 센서 A보다 더 민감 할 수 있으며이를 통계적으로 설명하고 싶습니다. 이 분석에는 "진실"이 없지만 센서 A & B와 독립적 인 센서 C가 있습니다. 따라서 A / B와 C 사이의 더 나은 합의는 "진실"과 더 나은 합의를 나타냅니다. (이것은 흔들리는 것처럼 보일 수 있지만, 당신은 나를 믿어야 할 것입니다. 저는 센서에 대한 다른 연구에서 알려진 것을 바탕으로 여기에 탄탄합니다.)
그러므로 문제는 "시계열의 더 나은 합의"를 정량화하는 방법입니다. 상관 관계는 분명한 선택이지만 모든 0에 영향을 미치며 (제외 할 수 없음) 물론 최대 값에 의해 불균형하게 영향을받습니다. RMSE도 계산할 수 있지만 거의 제로인 경우 센서의 동작에 대한 가중치가 높습니다.
Q1 : 0이 아닌 값에 로그 스케일링을 적용하고 시계열 분석에서 0과 결합하는 가장 좋은 방법은 무엇입니까?
Q2 :이 유형의 시계열 분석에 어떤 "모범 사례"를 추천 할 수 있습니까? 0이 아닌 값의 동작이 초점이지만 0의 값이 지배적이며 제외 할 수없는 경우는 무엇입니까?