반복 측정 ANOVA가 구 형성을 가정하는 이유는 무엇입니까?


10

반복 측정 ANOVA가 구 형성을 가정하는 이유는 무엇입니까?

구 형성이란 그룹 간의 모든 쌍별 차이의 분산이 동일해야한다는 가정을 의미합니다.

특히, 나는 이것이 왜 가정되어야하는지 이해하지 못하며 관찰 된 그룹 점수의 분산 자체가 동일하지 않다.


1
여기 에 주석을 달았 듯이 RM 수준 간의 차이 변수는 원점에 따라 묶여 있기 때문에 구형도는 동일한 분산을 의미합니다.
ttnphns

1
대답하기 전에 독립 측정 ANOVA가 분산의 동질성 가정을 갖는 이유를 이해하면 도움이 될 것입니다.
John

@ 존 내 이해는 이것이 stats.stackexchange.com/questions/81914/…에 주어진 답입니다. 그 질문에 올바르게 대답합니다.
user1205901-복원 Monica Monica

@ttnphns 불행히도 나는 당신의 대답을 잘 이해하지 못합니다. 당신이나 다른 포스터가 좀 더 자세한 답변을 원하십니까?
user1205901-복원 Monica Monica

답변:


2

구형도 가정의 직관

일반적이고 반복되지 않는 측정의 가정 중 하나 인 ANOVA는 모든 그룹에서 동일한 분산입니다.

선형 회귀 분석에서 OLS 추정기가 BLUE이어야하고 해당 t- 검정이 유효하기 위해서는 동분 산성 (homoscedasticity ) 이라고도하는 등분 산이 필요하기 때문에이를 이해할 수 있습니다 ( 가우스-마코프 정리 참조) . 회귀.)

RM-ANOVA 사례를 비 RM 사례로 축소 해 봅시다. 간단하게하기 위해, k 개의 RM 조건 에서 피험자가 기록 된 단일 요인 RM-ANOVA (피험자 간 효과 없음)를 다룰 것 입니다.nk

각 주제에는 고유 한 주제별 오프셋 또는 인터셉트가있을 수 있습니다. 한 그룹의 값을 다른 모든 그룹의 값에서 빼면 이러한 차단을 취소하고 비 RM-ANOVA를 사용하여 이러한 그룹 차이가 모두 0 인지 테스트 할 수있는 상황에 도달 합니다. 이 검정이 유효하려면 이러한 k - 1 차이 의 등분 산 가정이 필요합니다 .k1k1

이제 다른 모든 그룹에서 그룹 # 2를 빼고 다시 같은 분산을 가져야하는 차이에 도달 할 수 있습니다. k 에서 각 그룹 에 대해 해당 k - 1 차이 의 분산 이 같아야합니다. 모든 k ( k - 1 ) / 2 가능한 차이가 같아야한다는 것이 금방 이어 집니다.k1kk1k(k1)/2

정확히 구형도 가정입니다.

왜 그룹 분산이 같지 않아야합니까?

우리는 RM-ANOVA 생각할 때, 우리는 일반적으로 양식의 간단한 첨가제 혼합 모델 스타일의 모델을 생각 α 내가 될 효과이며, β j는 있습니다 및 조건 효과 ε ~ N ( 0 , σ 2 ) .

yij=μ+αi+βj+ϵij,
αiβjϵN(0,σ2)

이 모델의 경우 그룹 차이는 을 따릅니다 . 즉, 모두 동일한 분산 2 σ 2 를 가지므로 구 형성이 유지됩니다. 그러나 각 그룹은 α i의 평균 과 분산 σ 2n 가우스 혼합을 따릅니다. 이는 분산 V ( α , σ 2 ) 를 사용하여 그룹 전체에 일정한 분포를 갖는 복잡한 분포입니다 .(β제이1β제이2,2σ2)2σ2α나는σ2V(α,σ2)

따라서이 모델에서 실제로 그룹 분산도 동일합니다. 그룹 공분산도 동일합니다. 즉,이 모델은 복합 대칭을 의미 합니다 . 이것은 구형 도와 비교하여 더 엄격한 조건입니다. 쇼 위 내 직관적 인수로, RM-ANOVA 위 기록 첨가제 모델은보다 일반적인 상황에서 잘 작동 할 수 있습니다 보유하지 않습니다 .

정확한 수학적 진술

내가 여기서 뭔가를 추가하기 위하여려고하고있다 후인 & FELDT 1970, 반복 측정 디자인의 조건에서 어느 평균 스퀘어 비율 정확한 되세요 -Distributions은에프 .

구형이 깨지면 어떻게됩니까?

구형이 유지되지 않는 경우, RM-ANOVA가 (i) 크기가 커졌고 (타입 I 오류가 더 많음), (ii) 전력이 감소했습니다 (타입 II 오류가 더 많음). 시뮬레이션을 통해이를 탐색 할 수 있지만 여기서는하지 않겠습니다.


4

구 형성을 위반하는 효과는 전력 손실 (즉, 유형 II 오차의 증가 된 확률) 및 단순히 검정 된 F- 분포 값과 비교할 수없는 검정 통계량 (F- 비)이라는 것이 밝혀졌다. F- 검정은 너무 자유 로워집니다 (즉, 귀무 가설이 참일 때 귀무 가설의 기각 비율이 알파 수준보다 큽니다.

이 주제에 대한 정확한 조사가 매우 관련되어 있지만 다행히도 Box 등은 다음에 관한 논문을 썼습니다 : https://projecteuclid.org/download/pdf_1/euclid.aoms/1177728786

요컨대, 상황은 다음과 같습니다. 먼저, S 과목과 A 실험 처리를 사용하여 한 가지 요인으로 반복 측정 설계를한다고 가정합니다.이 경우 독립 변수의 효과는 F 통계량을 계산하여 테스트합니다.이 통계는 평균 제곱에 의한 평균 효과 제곱의 비율로 계산됩니다. 주제 인자와 독립 변수 사이의 상호 작용 구형이 유지 될 때,이 통계량은 υ 2 = ( A - 1 ) ( S - 1 ) 자유도를 갖는 Fisher 분포를 갖습니다 .υ1=1υ2=(1)(에스1)

위의 기사에서, 구형이 실패 할 때, 올바른 자유도가 F의 이되는 것은 다음과 같이 진구 ϵ 에 의존 한다 : υ 1 = ϵ ( A - 1 ) υ 2 = ϵ ( A - 1 ) ( S - 1 )υ1ϵ

υ1=ϵ(1)
υ2=ϵ(1)(에스1)

또한 Box는 인구 공분산 행렬에 적용되는 구형도를 도입했습니다 . 우리가 호출하면 이 AXA 테이블의 항목을 다음 인덱스입니다ξ,

ϵ=(ξ,)2(1),'ξ,'2

구형의 Box 지수는 공분산 행렬의 고유 값과 관련하여 가장 잘 이해됩니다. 공분산 행렬은 양의 반 정규 행렬의 클래스에 속하므로 항상 null 고유 값의 양을 갖습니다. 따라서, 구형도 조건은 모든 고유 값이 상수와 동일한 것과 동일하다.

따라서 구형이 위반 될 때 F 통계에 대한 일부 수정을 적용해야하며이 수정의 가장 주목할만한 예는 온실-가이저 및 Huynh-Feldt입니다.

수정하지 않으면 결과가 편향되어 신뢰할 수 없게됩니다. 도움이 되었기를 바랍니다!


+1. 나중에 더 언급 할 것이지만 지금은 첫 번째 단락에서 검정력과 크기를 혼합합니다. 구형이 위반되면 무엇이 손상됩니까? null 아래의 제 1 종 오류율? 아니면 힘? 아니면 둘다? 아마 두 가지를 모두 의미하지만 공식은 명확하지 않습니다 (제 생각에). 또한, 그것은 "Box et al"이 아닙니다, 그것은 Box 혼자입니다 :)
amoeba

Box가 보여준 것처럼 구형이 위반 될 때 우리는 완전히 다른 통계 (또 다른 자유도)에 의존해야하기 때문에 나는 힘이 대부분 손상 될 것이라고 생각합니다. 우리가 그것에 의존하지 않는다면, 우리의 위반이 얼마나 강한 지에 따라 귀무 가설에 대한 거부 비율이 더 커질 것입니다.
광대 한 아카데미

죄송합니다, 여전히 귀하의 의견에 의해 혼란 스럽습니다 : "널의 거절의 더 큰 비율"-널이 실제로 참이라는 것을 의미합니까? 그러나 이것은 전력과 관련이 없습니다. 이것은 유형 I 오류율입니다.
amoeba

+10. 나는이 답변에 내 현상금을 수여합니다. 그것은 좋으며 또한 현상금 기간에 나타난 유일한 답변이기도합니다. 나는 당신의 대답에 아직 만족하지 못하지만 (아직?) 나는 내 자신의 대답을 작성하기 시작했지만 (현재 불완전하지만 이미 게시되어 있음), 기초 수학에 대한 부분적인 이해 만 있습니다. 귀하의 답변이 확실히 도움이되었고 Box 1954에 대한 언급도 매우 도움이됩니다.
amoeba

ϵϵξ×

1

와이나는제이케이나는=1,...,나는;제이=1,...,제이;케이=1,...,케이.

i 번째 그룹의 표본 평균은

와이¯나는..=1제이케이제이=1제이케이=1케이와이나는제이케이

ij 번째 주제의 주제는

와이¯나는제이.=1케이케이=1케이와이나는제이케이

대상 간의 독립성을 가정하면 두 그룹 평균 간의 차이 차이는 다음과 같습니다.

V아르 자형(와이¯나는..와이¯나는'..)=1제이2제이=1제이V아르 자형(와이¯나는제이.)+1제이2제이'=1제이V아르 자형(와이¯나는'제이'.)

V아르 자형(와이¯나는제이.)σ2/케이σ2V아르 자형(와이¯나는제이.)

이제, 진구 심 질문에 제기되었습니다.

와이¯..케이와이¯..케이'

와이¯..케이=1나는제이나는=1나는제이=1제이와이나는제이케이.
와이나는제이케이와이나는제이케이'

V아르 자형(와이¯..케이와이¯..케이')=1(나는제이)2나는=1나는제이=1제이V아르 자형(와이나는제이케이와이나는제이케이')

따라서 모든 쌍별 차이의 일정한 분산을 가정하면 공통 분산이 추정되면 t- 검정을 수행하는 것이 유효합니다. 이 가정은 각 관측치의 일정한 분산과 함께 모든 측정 쌍 간의 공분산이 모든 쌍에서 일정하다는 것을 의미합니다.- Sergio이 주제에 대한 좋은 소식이 있습니다. 따라서 가정은 대각선으로 일정하고 대각선으로 다른 상수를 갖는 행렬로 각 대상의 반복 측정을위한 분산 공분산 구조를 제공합니다. 비 대각선 항목이 모두 0 일 때, 그것은 모든 독립 모델로 줄어 듭니다 (많은 반복 된 측정 연구에 부적합 할 수 있습니다). 오프 대각선 입력이 대각선 입력과 동일 할 때 반복 측정은 피사체와 완벽하게 상관되며 이는 단일 측정이 각 피사체에 대한 모든 측정만큼 우수하다는 것을 의미합니다. 마지막 주 – 단순 분할 플롯 설계에서 K = 2 인 경우 구형 조건이 자동으로 충족됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.