시계열에 가장 적합한 통계 검정은 무엇입니까?


16

정기적으로 데이터 세트당 5-10 개의 데이터 포인트가있는 간단한 시계열이 있습니다. 두 데이터 세트가 다른지 여부를 결정하는 가장 좋은 방법이 무엇인지 궁금합니다. 각 데이터 포인트에서 t- 검정을 시도하거나 곡선 아래의 영역을보아야합니까, 아니면 더 잘 작동하는 다변량 모델이 있습니까?


"다른"은 무엇을 의미합니까?
Shane

당신은 "5-10 데이터 포인트로 무엇을 의미합니까 데이터 세트 당 "?
S. Kolassa-복원 자 Monica Monica

나는 그가 몇개의 시계열을 가지고 있다고 생각한다.
Rob Hyndman

나는 아직도이 질문이 "다른"의 의미를 이해하지 않고는 대답하기가 거의 불가능하다고 생각합니다.
Shane

저조한 질문에 대한 나의 견해. 달리 말하면 시계열의 과정에서 (개별 지점이 아닌) 두 치료 그룹간에 차이가 있는지 여부를 의미합니다. 그룹 간 변동 (내가 관심있는 것)뿐만 아니라 개체 간 변동 (내가 고려해야 할 것으로 생각되는)이있을 것입니다.
Dave

답변:


11

"다른"의 의미를 정확하게 지정해야합니다. 또한 각 시계열 내에서 직렬 상관 구조에 대해 어떤 가정을 기꺼이할지 지정해야합니다.

t- 검정을 사용하면 각 그룹 의 평균 을 비교하고 그룹이 동일한 분산을 갖는 독립적 인 관측치로 구성되어 있다고 가정합니다 (후자는 때때로 완화됨). 시계열을 테스트 할 때는 일반적으로 독립성을 가정하는 것이 합리적이지 않지만 지정된 상관 구조로이를 교체해야합니다. 예를 들어 시계열이 동일한 자기 상관을 사용하여 AR (1) 프로세스를 따르는 것으로 가정 할 수 있습니다. 결과적으로, 독립적 인 데이터보다 두 개 이상의 시계열의 평균을 비교하는 것조차 상당히 어렵다.

각 시계열에 대해 어떤 가정을하고 싶고 비교하고 싶은지 신중하게 지정한 다음 모수 부트 스트랩 (가정 모델 기반)을 사용하여 테스트를 수행합니다.


6

아마도 반복 측정 anova는 당신이 원하는 것입니다. 피사체 당 "시계열"의 상관 된 구조를 사용하면서 (피사체 간) 피사 체 (피사체 간 요인)를 비교할 수 있습니다. 이 방법은 쉽지만 날짜가있는 방법이며 "일반 선형 모델"과 관련하여 찾을 수 있으며 몇 가지 추가 기능 (예 : 구형)이 필요합니다. 또 다른 방법은 더 일반적인 상관 관계 구조 (Rob가 제안한 AR (1)조차도)와 불균형 데이터를 허용하는 혼합 선형 모델 일 수 있습니다.


2

간단한 선형 추세를 원한다면 다양한 시점에서 각 데이터 세트의 차이를 취하고 선의 기울기가 0인지 테스트 할 수 있습니다.

랄프 윈터스

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.