선형 회귀의 가정이 무엇인지 조금 혼란 스럽습니다.
지금까지 나는 여부를 확인했다.
- 모든 설명 변수는 응답 변수와 선형으로 상관됩니다. (이 경우였다)
- 설명 변수 사이에 공선 성이있었습니다. (공동성이 거의 없었습니다).
- 내 모델의 데이터 포인트의 Cook 거리가 1 미만입니다 (이 경우 모든 거리가 0.4 미만이므로 영향 지점이 없음).
- 잔차는 정규 분포입니다. (이것이 아닐 수도 있습니다)
그러나 나는 다음을 읽습니다.
정규성 위반은 종종 (a) 종속 변수 및 / 또는 독립 변수의 분포가 그 자체로 상당히 비정규 적이거나, 또는 (b) 선형성 가정이 위반되기 때문에 발생합니다.
질문 1 이것은 독립 변수와 종속 변수가 정상적으로 분포되어야하는 것처럼 들리지만 이것이 아는 한은 아닙니다. 내 종속 변수와 독립 변수 중 하나가 정상적으로 분포되지 않습니다. 그들이해야합니까?
질문 2 잔차의 QQnormal 플롯은 다음과 같습니다.
이는 정규 분포와 약간 다르며 shapiro.test
잔차가 정규 분포에서 나온 귀무 가설을 기각합니다.
> shapiro.test(residuals(lmresult))
W = 0.9171, p-value = 3.618e-06
잔차 대 적합치 값은 다음과 같습니다.
잔차가 정규 분포가 아닌 경우 어떻게해야합니까? 선형 모델이 완전히 쓸모가 없다는 것을 의미합니까?