시계열 유의성 검정에 대한 일시적인 해결책은 무엇입니까?


9

시계열 데이터에 대한 평균 차이 검정에 사용할 적절한 풀링 수준에 대한 지침이 필요합니다. 나는이 응용에서 긴장하고있는 것처럼 보이는 시간적, 희생적인 의사 복제에 대해 우려하고있다. 이는 조작 실험이 아닌 월경 연구와 관련이 있습니다.

모니터링 실습 고려 : 센서 시스템은 연못의 폭과 깊이에 걸쳐 많은 위치에서 용존 산소 (DO) 함량을 측정합니다. DO는 일마다 달라지는 것으로 알려져 있으므로 각 센서에 대한 측정 값은 매일 두 번 기록됩니다. 두 값은 일일 값을 기록하도록 평균화됩니다. 일주일에 한 번, 일일 결과는 전체 연못에 대해 단일 주간 DO 농도에 도달하기 위해 공간적으로 집계됩니다.

이러한 주별 결과는 정기적으로보고되고 추가 집계됩니다. 주별 결과는 평균적으로 연못에 대한 월별 DO 농도를 제공합니다. 월별 결과는 평균적으로 연간 가치를 제공합니다. 연평균은 그 자체로 연못에 대한 10 년 DO 농도를보고하기 위해 평균화된다.

목표는 다음과 같은 질문에 답하는 것입니다. X 년의 연못의 DO 농도는 Y 년의 농도와 같거나 높거나 낮습니까? 지난 10 년의 평균 DO 농도가 이전 10 년의 평균 DO 농도와 다른가? 연못의 DO 농도는 많은 양의 많은 입력에 반응하므로 상당히 다양합니다. 유의성 테스트가 필요합니다. 방법은 평균의 T- 검정 비교를 사용하는 것입니다. 10 진수 값이 연간 값의 평균이고 연간 값이 월간 값의 평균이라는 점을 고려할 때 이는 적절한 것으로 보입니다.

문제는 다음과 같습니다 . 10 월 DO 값 또는 연간 DO 값에서 10 진수 평균과 해당 평균의 T- 값을 계산할 수 있습니다. 물론 평균은 변하지 않지만 신뢰 구간과 T- 값의 너비는 변합니다. 월 단위 값을 사용하여 달성 한 N의 순서가 높아서 CI는 종종 해당 경로로 이동하면 상당히 강화됩니다. 이는 동일한 데이터에 대해 동일한 테스트를 사용하여 평균에서 관측 된 차이의 통계적 유의성에 대해 연간 값을 사용하는 것과 반대되는 결론을 줄 수 있습니다. 이 불일치에 대한 올바른 해석은 무엇입니까?

월별 결과를 사용하여 십진수 평균의 차이에 대한 테스트 통계를 계산하는 경우 시간적 의사 복제를 무시하고 있습니까? 연간 결과를 사용하여 10 진수 테스트를 계산하는 경우 정보를 희생하여 의사 복제 하는가?


당신의 질문은 다소 까다 롭습니다 ... 생각하고 있습니다.
deps_stats

답변:


1

데이터를 일시적 및 공간적으로 상관시키면서 독립적 인 관측에 적합한 통계적 방법을 사용하려고합니다. 관측치가 5 시간 동안 있고 매분 241 개의 관측치로 이것을 다시 언급하기로 결정한 경우,이 241 값의 평균과 관련하여 240 도의 자유도가 없습니다. 자기 상관은 잠재적으로 "N"의 크기를 과장되게하여 잘못된 불확실성을 진술합니다. 당신이해야 할 일은 시계열 데이터와 분석에 대해 가르쳐 줄 누군가 / 일부 교과서 / 일부 웹 사이트 / ...를 찾는 것입니다. 시작하는 한 가지 방법은 GOOGLE "시계열 이해에 도움을주고"읽고 배우기 시작하는 것입니다. 웹에는 많은 자료가 있습니다.http://www.autobox.com/AFSUniversity/afsuFrameset.htm . 나는 여전히이 회사와 관련이있는 것으로 언급하고 있으며, 따라서 제 의견은 "편견과 의견을 수렴"하는 것이지만 자급 자족하는 것은 아닙니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.