R : 선형 모형 잔차의 정규성을 테스트-사용할 잔차


13

정규성을 확인하기 위해 선형 모형의 잔차에 대해 Shapiro Wilk의 W 검정 및 Kolmogorov-Smirnov 검정을 수행하고 싶습니다. 원시 잔차, Pearson 잔차, 학생 잔차 또는 표준화 잔차에 대해 어떤 잔차를 사용해야하는지 궁금합니다. Shapiro-Wilk의 W 테스트의 경우 원시 및 Pearson 잔차에 대한 결과는 동일하지만 다른 결과는 그렇지 않은 것으로 보입니다.

fit=lm(mpg ~ 1 + hp + wt, data=mtcars)
res1=residuals(fit,type="response")
res2=residuals(fit,type="pearson")
res3=rstudent(fit)
res4=rstandard(fit)
shapiro.test(res1) # W = 0.9279, p-value = 0.03427
shapiro.test(res2) # W = 0.9279, p-value = 0.03427
shapiro.test(res3) # W = 0.9058, p-value = 0.008722
shapiro.test(res4) # W = 0.9205, p-value = 0.02143

KS에 대한 동일한 질문 및 잔차가 다음과 같이 정규 분포 (정상)에 대해 테스트되어야하는지 여부

ks.test(res1, "pnorm") # D = 0.296, p-value = 0.005563

또는 다음과 같이 자유도가 nk-2 인 t- 학생 분포

ks.test(res3, "pt",df=nrow(mtcars)-2-2) 

조언이 있을까요? 또한 분포가 정규성과 충분히 가깝고 추론에 큰 영향을 미치지 않도록하기 위해 검정 통계량 W (> 0.9?) 및 D에 권장되는 값은 무엇입니까?

마지막으로,이 접근법은 적합 된 lm 계수의 불확실성을 고려합니까 , 아니면 cumres()패키지 기능 gof()이이 점에서 더 좋을까요?

건배, 톰


9
그러한 시험이 어떤 점을 갖는 것은 드문 일입니다. 잔차가 "정상적으로"비정규로 판명 된 경우 어떤 구체적 조치를 취해야하는지 자문하십시오. 경험은 그것이 정상과 얼마나, 그리고 얼마나 다른지에 달려 있다고 가르칩니다 . 이들 중 어느 것도 SW, KS 또는 다른 공식적인 분포 테스트에 의해 직접 (또는 적절하게) 측정되지 않습니다. 이 작업 에서는 공식 테스트가 아닌 탐색 그래픽 을 사용하려고 합니다 . 어떤 잔차가 플로팅에 적합한 지에 대한 질문은 여전히 ​​유효하지만 나머지 질문은 관련이없는 것으로 떨어집니다.
whuber

예, 많은 통계 학자들이이 입장을 옹호하는 것으로 나타났습니다. 그러나 여전히 이러한 테스트의 테스트 통계를 확인하고 싶습니다 (예 : Shapiro Wilks W의 값이 0.9보다 큰지 확인). 그리고 나는 항상 편차가 큰 경우 정규성을 향상시키기 위해 Box-Cox 변환 등을 수행 할 수 있습니다. 게다가 제 질문은 부분적으로 개념적인 것이 었습니다. 즉, 정규성이 실제로 실제로 그렇게 중요하지는 않더라도 이것의 가장 올바른 방법은 무엇
일까요

답변:


9

댓글을 작성하기에 너무 오래 자랐습니다.

  1. 일반적인 회귀 모형 (예 :에 적합 lm)의 경우 처음 두 잔차 유형 사이에는 차이가 없습니다. type="pearson"비 가우시안 GLM과 관련이 있지만 response가우시안 모델 과 동일 합니다.

  2. 검정을 적용한 관측치 (일부 형태의 잔차)는 독립적이지 않으므로 일반적인 통계는 올바른 분포를 갖지 않습니다. 또한 엄밀히 말하면 데이터가 정확히 정상적이지 않기 때문에 고려하는 잔차 중 어느 것도 정확하게 정상이 아닙니다. [공식 테스트는 잘못된 질문에 답합니다.보다 관련성 높은 질문은 '이 비정규 성이 내 추론에 얼마나 영향을 미칩니 까?'입니다. 일반적인 질문의 적합 가설 검정으로 대답하지 않는 질문입니다.]

  3. 데이터가 정확히 정상이더라도 세 번째 또는 네 번째 종류의 잔차는 정확히 정상이 아닙니다. 그럼에도 불구하고 사람들이 원시 잔차보다 그 (QQ 플롯으로)를 검사하는 것이 훨씬 일반적입니다.

  4. X

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.