시계열에 대한 가설 검정 및 의의


19

두 모집단을 볼 때 일반적인 유의성 검정은 가능하면 t- 검정, 쌍 t- 검정입니다. 이것은 분포가 정상이라고 가정합니다.

시계열에 대한 유의성 검정을 생성하는 유사한 단순화 가정이 있습니까? 구체적으로 우리는 다르게 처리되고있는 상당히 적은 양의 생쥐를 가지고 있으며, 일주일에 한 번 체중을 측정하고 있습니다. 두 그래프 모두 그래프가 매끄럽게 증가하면서 부드럽게 증가하는 기능을 표시합니다. 이 문맥에서 "정확성"을 어떻게 정량화합니까?

귀무 가설은 두 모집단의 가중치가 시간이 지남에 따라 "동일한 방식으로"행동해야한다는 것입니다. 적은 수의 모수만으로 상당히 일반적인 (정규 분포와 같은) 단순 모형의 관점에서이를 어떻게 공식화 할 수 있습니까? 일단 그렇게하면, 어떻게 p- 값과 유사한 의미를 측정 할 수 있습니까? 가능한 한 많은 특성과 일치하는 두 쌍의 모집단에서 각각 하나의 대표를 가진 마우스를 쌍으로 묶는 것은 어떻습니까?

시계열에 대해 잘 작성되고 이해하기 쉬운 관련 서적이나 기사에 대한 조언을 환영합니다. 나는 무시로 시작합니다. 당신의 도움을 주셔서 감사합니다.

데이비드 엡스타인


반드시 시계열 문제가 아니기 때문에 더 넓은 순을 캐스트하는 것이 좋습니다. 실제로, 여기서 가장 근본적인 질문은 치료 "종점"을 정량화하는 최선의 또는 적어도 올바른 방법에 관한 것입니다. 특정 시간 이후 인구의 성장, 시간 경과에 따른 평균 성장률 등입니까? 실험을 시작하기 전에 이것을 알지 못하고 갑자기 성장 곡선의 일관된 차이를 발견 한 경우 확인 모드가 아닌 탐색 모드 에서 작업 하고 있으며 가설 검정 p- 값이 기만적으로 좋습니다.
whuber

결과는 예상대로 정 성적이며 일방적 인 테스트가 적합 해 보입니다. 시계열에 대해 물었던 이유는 최종 가중치 (가장 관련성이 높은 측정) 만 측정하면 이전 시점에서 모든 정보를 버리고 잘못된 것으로 보입니다.
David Epstein 23

당신이 옳습니다 : 당신은 그 데이터를 버리고 싶지 않습니다. 그러나 시계열 기법은 이상적인 곡선 과의 편차의 시간적 상관 관계가 자신의 관심이나 좋은 추정을 방해 할 수 있기 때문에 중요한 데이터 모델에 앞장서고 있습니다. 귀하의 상황은 이러한 경우 중 하나에 해당하지 않을 것입니다. 더 간단하고 과학적으로 의미있는 방법을 사용할 수 있습니다.
whuber

@ whuber, 마우스 컨트롤 세트의 시간에 따른 가중치가 어떤 의미에서 "이상화 된 곡선"이 아닙니까? 아니면 적어도 그 데이터에 맞는 이론적 모델입니까?
naught101

1
예, @naught, 그것은 그것을 보는 합리적인 방법입니다. 그러나 "곡선"은 "시계열"과 동일하지 않습니다. 예를 들어, 선형 회귀는 데이터에 대한 적합 곡선으로 볼 수 있지만 종종 시계열 분석과는 별개로, 데이터와 이상적인 곡선 간의 편차 간의 상관 관계 구조를 강조합니다.
whuber

답변:


1

무게 변화를 역동적 인 과정으로 생각하면 여러 가지 방법이 있습니다.

예를 들어 적분기로 모델링 할 수 있습니다. 엑스˙()=θ엑스()+V()

여기서 는 무게 변화이며, θ 는 무게 변화의 속도와 관련이 있으며 v ( t ) 는 무게 변화에 영향을 줄 수있는 확률 적 장애입니다. 당신은 모델 수 V ( t )N ( 0 , Q를 ) 알려진 들어, Q (당신은 또한을 추정 할 수있다).엑스()θV()V()(0,)

여기에서 예를 들어 예측 오류 방법을 사용하여 두 모집단 (및 공분산)에 대한 모수 를 식별 할 수 있습니다 . 가우스 가정이 유지되는 경우 예측 오류 방법을 사용하면 θ 의 추정값이 가우시안 (무증상)임을 알 수 있으므로 θ 1 의 추정치 가 통계적으로 θ 2 의 추정치에 가까운 지 여부를 확인하기 위해 가설 검정을 작성할 수 있습니다.θθθ1θ2 .

참고로이 책을 제안 할 수 있습니다 .


0

각 마우스에 대해 ARIMA 모델을 별도로 식별 한 다음 유사성과 일반화에 대해 검토 할 것을 제안합니다. 예를 들어 첫 번째 마우스에 AR (1)이 있고 두 번째 마우스에 AR (2)가있는 경우 가장 일반적인 (가장 큰) 모델은 AR (2)입니다. 이 모델을 전 세계적으로 (예 : 결합 된 시계열) 추정하십시오. 조합 된 세트의 오차 제곱합을 두 개의 개별 오차 제곱합의 합과 비교하여 F 값을 생성하여 그룹 전체에서 상수 매개 변수의 가설을 테스트합니다. 데이터를 게시 할 수 있으면이 테스트를 정확하게 설명하겠습니다.

추가 댓글:

데이터 세트이므로 자동 상관 정규성이 적용되지 않습니다. 관측치가 시간에 따라 독립적 인 경우 잘 알려진 비 시간 계열 방법 중 일부를 적용 할 수 있습니다. 시계열에 대한 읽기 쉬운 책에 대한 요청의 관점에서 Addison-Wesley의 Wei 텍스트를 제안합니다. 사회 과학자들은 Mcleary and Hay (1980)의 비 수학적 접근법이보다 직관적이지만 엄격하지 않다는 것을 알게 될 것입니다.


1
이것은 근본적인 문제를 해결하는 것으로 보이지 않습니다. (1) 왜 그러한 모델이 적합한가? (2) 왜 각각의 마우스가 모델링되어야하고 평균 인구 체중이나 체중 증가가 아닌가? (3) 상수 매개 변수 테스트가 왜 관련이 있습니까? 질문은 단측 테스트를 요구합니다. 언급 한 대부분의 매개 변수는 과학적으로 관련이없는 것으로 보이지 않으며, 한 그래프가 다른 그래프보다 일관되게 상식적임을 직접 정량화하지도 않습니다. (4) 실험 시작시 두 모집단의 특성에서 가능한 차이를 어떻게 제어합니까?
whuber

: whuber 매개 변수의 불일치에 대한 테스트는 첫 번째 판독 그룹 formouse 1 및 두 번째 마우스에 대한 두 번째 계수 세트에 대한 계수가 있기 때문에 관련이 있습니다. 문제는 "계수 사이에 집단적으로 유의 한 차이가 있다는 것"입니다. 모델 계수 중 하나는 상수 일 수 있고 계수 인 경우 계수가 서로 통계적으로 다르기 때문에 계수 간의 차이가 발생할 수 있습니다. 기본 ARIMA 모델은 차이 모델 일 수 있으므로 상수를 가질 필요는 없습니다.
IrishStat

1
나는 당신이 부분적으로 옳다고 생각하지만 문제의 특징을 세분화해야합니다. 많은 ARIMA 계수는 과학적으로 관련이 없을 수 있습니다. 예를 들어, 그 중 하나가 시간이 지남에 따라 2 차 항처럼 작용하면 차이가 성장 곡선 의 모양 에 대해 말할 수 있지만 거의 쓸모가 없습니다. 실험 종점 (들)을 반영하기 위해 계수를 선택하고 이들 시험 한다면, 이에 따라 약간의 이점이 달성 될 수있다. 그러나 일반적으로 시계열 모델은 여기에 직접적인 과학적 관심이없는 계수 (예 : 자기 상관)를 도입합니다.
whuber

whuber : "실험적인 종말점을 반영하기 위해 계수를 선택하고 그것들 만 테스트한다면, 중간 점을 무시하기 때문에 나에게 큰 의미가 없습니다." 귀하의 의견과는 달리 시계열 모드와 그에 수반되는 계수는 판독 분포를 특성화하고이를 자기 상관 구조가없고 테스트가 가능한 랜덤 프로세스 (오류 항)로 변환하기 때문에 과학적으로 중요한 관심사입니다. 정규성을 요구합니다. 내가 제안한 시험은 그 가정을 유지해야한다.
IrishStat

1
자기 상관은 여기서 중요하지 않을 수 있습니다. 관심은 추세에 명시 적으로 초점을 맞 춥니 다. 기본 성장 곡선이 두 인구간에 어떻게 다른 경향이 있습니까? 자기 상관 매개 변수는 성가신 곡선의 추정을 개선하는 데 도움이 될 수있는 경우에만 도입되고 처리되는 방해 매개 변수입니다. 첫 번째 우선 순위는 과학적 성장 모델을 채택하고 해석 가능하고 관심있는 매개 변수로 해당 모델을 표현한 후 추정 하는 것입니다. 시계열 기술을 자동으로 적용 할 수는 없습니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.