R에는 348 개의 측정 값 샘플이 있으며, 향후 테스트를 위해 정상적으로 분포되어 있다고 가정 할 수 있는지 알고 싶습니다.
본질적으로 다른 스택 답변 을 따라 밀도 플롯과 QQ 플롯을보고 있습니다.
plot(density(Clinical$cancer_age))
qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)
통계에 대한 경험이 많지 않지만 내가 본 정규 분포의 예처럼 보입니다.
그런 다음 Shapiro-Wilk 테스트를 실행 중입니다.
shapiro.test(Clinical$cancer_age)
> Shapiro-Wilk normality test
data: Clinical$cancer_age
W = 0.98775, p-value = 0.004952
올바르게 해석하면 귀무 가설을 기각하는 것이 안전하다는 것을 알 수 있습니다. 즉, 분포가 정상입니다.
그러나 두 개의 스택 게시물 ( here 및 here )이 발생 하여이 테스트의 유용성을 크게 손상시킵니다. 표본이 크면 (348이 큰 것으로 간주 됨) 항상 분포가 정상이 아니라고 말합니다.
이 모든 것을 어떻게 해석해야합니까? QQ 플롯을 고수하고 분포가 정상이라고 가정해야합니까?