R에서 anova () 함수를 사용하여 두 모델 비교


32

의 설명서에서 anova():

일련의 객체가 주어지면 'anova'는 지정된 순서대로 모델을 테스트합니다.

모델을 서로 테스트한다는 것은 무엇을 의미합니까? 왜 순서가 중요합니까?

다음은 GenABEL 튜토리얼 의 예입니다 .

    >  modelAdd = lm(qt~as.numeric(snp1))
    >  modelDom = lm(qt~I(as.numeric(snp1)>=2))
    >  modelRec = lm(qt~I(as.numeric(snp1)>=3))
     anova(modelAdd, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ as.numeric(snp1)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2320                      
    2   2371 2320  1    0.0489     0.82
     anova(modelDom, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 2)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2322                      
    2   2371 2320  1      1.77     0.18
     anova(modelRec, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 3)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)  
    1   2372 2324                        
    2   2371 2320  1      3.53    0.057 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

이 출력을 어떻게 해석합니까?

답변:


31

를 사용할 때 anova(lm.1,lm.2,test="Chisq")카이-제곱 검정을 수행하여 비교 lm.1하고 lm.2(즉, 잔차 제곱합 감소가 통계적으로 유의한지 여부를 테스트) 이 차종은 경우에만 감지합니다 lm.1lm.2중첩 된 모델입니다.

α=0.05α=0.1

선형 모형 적합치에 대한 분산 분석도 확인하십시오 .


1
그러나 이것이 두 가지 중 하나가 더 낫다는 것을 의미합니까? 감사!
qed

5
"더 나은"이라는 용어를 어떻게 정의 하느냐에 달려 있습니다. 잔차 제곱합이 적은 모델로 정의하면 정답입니다. 이 테스트는 잔차 제곱합의 감소를 비교하기 때문입니다.
Stat

3
반면에 두 모델이 크게 다르지 않은 경우 더 간단한 모델이 더 낫다고 주장 할 수 있습니까? 나는 여기에서 양육에 대해 생각하고있다.
Sininho 2016 년

1
anova (mod1, mod2, test = "LRT")이 차이점은 무엇입니까?
ElleryL
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.