정기적으로 데이터 세트당 5-10 개의 데이터 포인트가있는 간단한 시계열이 있습니다. 두 데이터 세트가 다른지 여부를 결정하는 가장 좋은 방법이 무엇인지 궁금합니다. 각 데이터 포인트에서 t- 검정을 시도하거나 곡선 아래의 영역을보아야합니까, 아니면 더 잘 작동하는 다변량 모델이 있습니까?
정기적으로 데이터 세트당 5-10 개의 데이터 포인트가있는 간단한 시계열이 있습니다. 두 데이터 세트가 다른지 여부를 결정하는 가장 좋은 방법이 무엇인지 궁금합니다. 각 데이터 포인트에서 t- 검정을 시도하거나 곡선 아래의 영역을보아야합니까, 아니면 더 잘 작동하는 다변량 모델이 있습니까?
답변:
"다른"의 의미를 정확하게 지정해야합니다. 또한 각 시계열 내에서 직렬 상관 구조에 대해 어떤 가정을 기꺼이할지 지정해야합니다.
t- 검정을 사용하면 각 그룹 의 평균 을 비교하고 그룹이 동일한 분산을 갖는 독립적 인 관측치로 구성되어 있다고 가정합니다 (후자는 때때로 완화됨). 시계열을 테스트 할 때는 일반적으로 독립성을 가정하는 것이 합리적이지 않지만 지정된 상관 구조로이를 교체해야합니다. 예를 들어 시계열이 동일한 자기 상관을 사용하여 AR (1) 프로세스를 따르는 것으로 가정 할 수 있습니다. 결과적으로, 독립적 인 데이터보다 두 개 이상의 시계열의 평균을 비교하는 것조차 상당히 어렵다.
각 시계열에 대해 어떤 가정을하고 싶고 비교하고 싶은지 신중하게 지정한 다음 모수 부트 스트랩 (가정 모델 기반)을 사용하여 테스트를 수행합니다.
간단한 선형 추세를 원한다면 다양한 시점에서 각 데이터 세트의 차이를 취하고 선의 기울기가 0인지 테스트 할 수 있습니다.
랄프 윈터스