5 개의 가능한 회귀 변수가있는 고전적인 선형 모델이 있습니다. 그것들은 서로 관련이 없으며 응답과의 상관 관계가 매우 낮습니다. 회귀 분석기 중 3 개가 t 통계량에 유의 한 계수를 갖는 모형에 도달했습니다 (p <0.05). 나머지 2 개의 변수 중 하나 또는 둘 다를 추가하면 t 통계에 대한 p 값> 0.05가 추가되고 추가 된 변수에 대해 제공됩니다. 이것은 3 가지 변수 모델이 "최고"라고 믿게한다.
그러나 R에서 anova (a, b) 명령을 사용합니다. 여기서 a는 3 변수 모델이고 b는 전체 모델입니다. F 통계량의 p 값은 <0.05이므로 3 변수보다 전체 모델을 선호합니다. 모델. 이러한 명백한 모순을 어떻게 조정할 수 있습니까?
감사합니다 PS 편집 : 추가 배경. 이것은 숙제이므로 세부 사항을 게시하지는 않지만 회귀자가 나타내는 내용에 대한 세부 정보는 제공하지 않습니다. 1에서 5까지 번호가 매겨집니다. "적절한 모델을 도출하여 정당성을 부여해야합니다".