그룹간에 유의 한 차이가 있는지 테스트하기 위해 단방향 분산 분석을 수행하는 경우 내포 적으로 두 개의 중첩 모델을 비교하는 것입니다 (따라서 하나의 중첩 레벨 만 있지만 여전히 중첩 임).
이 두 모델은 다음과 같습니다.
- 와이나는 j나는제이β^0
와이나는 j= β^0+ ϵ나는
모형 1 : 값은 그룹의 추정 된 수단으로 모형화됩니다.
β제이^
와이나는= β^0+ β^제이+ϵ나는
평균과 등가 모형을 중첩 모형과 비교하는 예 : 홍채 데이터 세트에서 sepal 길이 (cm)를 보자 (4 개의 변수를 모두 사용하는 경우 실제로 Fisher는 1936 년에 Fisher와 마찬가지로 LDA 또는 MANOVA를 수행 할 수 있음)
관찰 된 총 및 그룹 평균은 다음과 같습니다.
μt o t a lμs e t o s aμv e r s i c o l o rμv 나는 r g을나는 n 나는 c a= 5.83= 5.01= 5.94= 6.59
다음은 모델 형식입니다.
모델 1 : 모델 2 : 와이나는 j= 5.83 + ϵ나는와이나는 j= 5.01 + ⎡⎣⎢00.931.58⎤⎦⎥제이+ ϵ나는
∑ ϵ2나는= 102.1683
∑ ϵ2나는= 38.9562
그리고 ANOVA 테이블은 다음과 같습니다 (그리고 2 자유도를 가진 테이블의 63.212 인 그룹 제곱의 합 사이 의 차이를 암시 적으로 계산합니다 ).
> model1 <- lm(Sepal.Length ~ 1 + Species, data=iris)
> model0 <- lm(Sepal.Length ~ 1, data=iris)
> anova(model0, model1)
Analysis of Variance Table
Model 1: Sepal.Length ~ 1
Model 2: Sepal.Length ~ 1 + Species
Res.Df RSS Df Sum of Sq F Pr(>F)
1 149 102.168
2 147 38.956 2 63.212 119.26 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
에프= R를 S에스디나는 f에프e r e n c eD F디나는 f에프e r e n c eR S에스N E wD FN E w= 63.212238.956147= 119.26
예제에서 사용 된 데이터 세트 :
아이리스 꽃 3 종에 대한 꽃잎 길이 (cm)
Iris setosa Iris versicolor Iris virginica
5.1 7.0 6.3
4.9 6.4 5.8
4.7 6.9 7.1
4.6 5.5 6.3
5.0 6.5 6.5
5.4 5.7 7.6
4.6 6.3 4.9
5.0 4.9 7.3
4.4 6.6 6.7
4.9 5.2 7.2
5.4 5.0 6.5
4.8 5.9 6.4
4.8 6.0 6.8
4.3 6.1 5.7
5.8 5.6 5.8
5.7 6.7 6.4
5.4 5.6 6.5
5.1 5.8 7.7
5.7 6.2 7.7
5.1 5.6 6.0
5.4 5.9 6.9
5.1 6.1 5.6
4.6 6.3 7.7
5.1 6.1 6.3
4.8 6.4 6.7
5.0 6.6 7.2
5.0 6.8 6.2
5.2 6.7 6.1
5.2 6.0 6.4
4.7 5.7 7.2
4.8 5.5 7.4
5.4 5.5 7.9
5.2 5.8 6.4
5.5 6.0 6.3
4.9 5.4 6.1
5.0 6.0 7.7
5.5 6.7 6.3
4.9 6.3 6.4
4.4 5.6 6.0
5.1 5.5 6.9
5.0 5.5 6.7
4.5 6.1 6.9
4.4 5.8 5.8
5.0 5.0 6.8
5.1 5.6 6.7
4.8 5.7 6.7
5.1 5.7 6.3
4.6 6.2 6.5
5.3 5.1 6.2
5.0 5.7 5.9
anova()
제 때문에 실제 ANOVA는 또한 F-test를 이용하고, 기능. 이것은 용어 혼동으로 이어진다.