두 모델 비교에 anova를 사용하는 방법은 무엇입니까?


9

anova두 모델을 비교할 때 결과를 어떻게 이해해야 합니까?

예:

  Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
1      9 54.032                                  
2      7  4.632  2      49.4 37.329 0.0001844 ***

맨 페이지에는 "하나 이상의 적합 모델 객체에 대한 분산 (또는 편차) 테이블의 계산 분석"이 나와 있습니다. 그러나 교수는 모델 비교에 사용될 수 있다고 언급했습니다.

따라서 anova(model1, model2)귀무 가설을 기각해야하는지 여부를 알려주는 p- 값을 사용 하고 얻을 수 있다고 가정 합니다.

p- 값이 0.05보다 작 으면 (즉, 모델이 크게 다름) 진술 할 수 있습니까?


귀하의 예에서 model1과 model2가 중첩되어 있습니까? 즉, 두 모델에 예측 변수의 공유 세트와 동일한 결과 변수가 있지만 하나의 모델에 하나 이상의 추가 예측 변수가 있습니까?
EdM

하나는 같고 Y ~ X + X^2다른 하나는Y ~ X + X^2 + X^3
petrbel

답변:


13

모형이 중첩되어 있다고 가정하면 (예 : 동일한 결과 변수 및 모형 2에 모형 1의 모든 변수와 2 개의 추가 변수가 포함 된 경우) 분산 분석 결과에 따르면 2 개의 추가 변수가 충분히 분산을 설명하여 귀무 가설을 기각 할 수 있습니다. 두 변수에 대한 계수는 0과 같습니다. 이것은 실제로 당신이 말한 것입니다. 두 계수가 모두 0이면 모형이 동일합니다.

추가 메모와 마찬가지로 ANOVA는 항상 모델 비교를 수행하는 것과 같습니다. 단일 모형의 분산 분석을 보면 각 예측 변수에 대한 효과를 제공합니다. 이는 전체 모델과 변수 중 하나를 제거하는 모델 간의 모델 비교를 수행하는 것과 같습니다. 즉, 는 제곱의 합 (유형 III)과 대한 검정 통계량을 제공 합니다. R은 타입 I 제곱합을 제공합니다. 유형 III이 필요한 경우 모델에서 변수의 순서를 사용 또는 사용 하고 계속 변경하고 마지막 변수의 제곱합 만 취하십시오.Model1:y=a+bx1+cx2+dx3;Model2:y=a+bx1+cx2x3car::Anovaanova


내가 당신을 올바르게 이해했다면, 0.05보다 작은 p- 값은 모델이 다르다는 것을 증명합니까?
petrbel

3
나는 그 단어들을 사용하지 않을 것입니다 (즉, "증명"과 "모델이 다릅니다"). 그러나 우리는 같은 것을 의미합니다. 데이터가 계수가 모두 0이라는 귀무 가설을 지원하지 않거나 데이터가 계수가 모두 0이 아니라는 대립 가설을 지원한다고
말하고 싶습니다.

1
모델이 다르거 나 귀무 가설이 지원되지 않는다는 주장이 제기되기 전에 데이터 가 p- 값의 계산 및 해석에 기초한 분산 분석가정을 합리적으로 충족하는지 확인하십시오 .
EdM

확실히, 제 1 형 제곱합에 대한 마지막 부분은 anova()하나의 모델에서 사용되는 상황에만 적용 됩니까?
재스퍼
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.