일반 선형 모형을 사용하면 회귀 모형으로 분산 분석 모형을 작성할 수 있습니다. 각각 두 개의 관측치, 즉 벡터 에 네 개의 관측치가있는 두 개의 그룹이 있다고 가정 해 봅시다 . 그러면 과도하게 매개 변수화 된 원래 모델은 . 여기서 는 예측 변수의 매트릭스입니다 (예 : 더미 코드 표시기 변수 :
E ( Y ) = X ⋆ β ⋆ X ⋆ ( μ 1 μ 1 μ 2 μ 2 ) = ( 1 1 0 1 1 0 1 0 1 1 0 1 ) ( β ⋆ 0 β ⋆ 1 β ⋆ 2 )yE(y)=X⋆β⋆X⋆
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜111111000011⎞⎠⎟⎟⎟⎛⎝⎜β⋆0β⋆1β⋆2⎞⎠⎟
같이 매개 변수를 식별 할 수없는 때문에 순위가 2 ( 는 되돌릴 수 없습니다). 이를 변경하기 위해 (처리 대비) 제약 조건을 도입하여 새로운 모델 :
X ⋆ ( X ⋆ ) ′ X ⋆ β ⋆ 1 = 0((X⋆)′X⋆)−1(X⋆)′E(y)X⋆(X⋆)′X⋆β⋆1=0E(y)=Xβ
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜11110011⎞⎠⎟⎟⎟(β0β2)
따라서 즉, 은 참조 카테고리 (그룹 1)에서 예상되는 값의 의미를 갖습니다. 즉, 는 참조 카테고리 와의 차이 의 의미를 취합니다 . 그룹이 두 개인 경우 그룹 효과와 관련된 매개 변수가 하나뿐이므로 ANOVA 귀무 가설 (모든 그룹 효과 매개 변수는 0 임)은 회귀 가중치 귀무 가설 (경사 매개 변수는 0)과 같습니다.μ1=β0β0μ2=β0+β2β2μ2−μ1
일반 선형 모형 의 검정 은 귀무 가설 하에서 가정 된 값 에 대해 모수 의 선형 조합 를 검정합니다. 선택하면 (기울기 매개 변수에 대한 일반적인 테스트)이라는 가설을 테스트 할 수 있습니다 . 즉, 여기에서 . 추정량은 . 여기서 는 모수에 대한 OLS 추정치. 이러한 대한 일반적인 테스트 통계는 다음과 같습니다.
tψ=∑cjβjψ0c=(0,1)′β2=0μ2−μ1=0ψ^=∑cjβ^jβ^=(X′X)−1X′yψ
t=ψ^−ψ0σ^c′(X′X)−1c−−−−−−−−−√
σ^2=∥e∥2/(n−Rank(X)) 는 오차 분산에 대한 편견없는 추정값입니다. 여기서 는 잔차 제곱의 합입니다. 두 그룹의 경우 , 이므로 추정값은 및 . 이 경우 가 1 인 경우 검정 통계량은
∥e∥2Rank(X)=2(X′X)−1X′=(.5−.5.5−.50.50.5)β^0=0.5y1+0.5y2=M1β^2=−0.5y1−0.5y2+0.5y3+0.5y4=M2−M1c′(X′X)−1c
t=M2−M1−0σ^=M2−M1∥e∥2/(n−2)−−−−−−−−−−√
t 는 df (여기서 ) 와 함께 분포됩니다 . 를 제곱 하면 의 ANOVA의 통계량 두 그룹 -test ( 사이를 들어, 다음 그룹 내에 대한) - 1과 갖는 분포 df.tn−Rank(X)n−2t(M2−M1)2/1∥e∥2/(n−2)=SSb/dfbSSw/dfw=FFbwFn−Rank(X)
그룹이 두 개 이상인 경우 분산 분석 가설 (모든 은 동시에 0, )은 둘 이상의 매개 변수를 나타내며 선형 조합 로 표현할 수 없으므로 검정은 동일하지 않습니다. .βj1≤jψ