답변:
Kolmogorov-Smirnov가 완전히 지정된 분포이기 때문에 두 값을 실제로 비교할 수도 없습니다. 따라서 정규성을 테스트하는 경우 평균과 분산을 지정해야합니다. 데이터에서 추정 할 수는 없습니다 * Shapiro-Wilk는 지정되지 않은 평균과 분산을 갖는 정규성을위한 것입니다.
* 또한 추정 된 매개 변수를 사용하여 표준화 할 수없고 표준 정규성을 테스트 할 수 없습니다. 그것은 실제로 같은 것입니다.
비교하는 한 가지 방법은 Shapiro-Wilk에 정규의 지정된 평균 및 분산에 대한 검정 (일부 방식으로 검정을 결합)을 보충하거나 KS 표를 모수 추정에 맞게 조정하여 (더 이상 분포가 아님) 보완하는 것입니다. -비어 있는).
그러한 시험이 있습니다 (추정 매개 변수가있는 Kolmogorov-Smirnov와 동일)-Lilliefors 시험; 정규성 테스트 버전은 Shapiro-Wilk와 유효하게 비교 될 수 있습니다 (일반적으로 전력이 더 낮습니다). 보다 경쟁력있는 Anderson-Darling 테스트 (비교가 유효하려면 매개 변수 추정에 대해서도 조정되어야 함).
그들이 테스트하는 것-KS 테스트 (및 Lilliefors)는 경험적 CDF와 지정된 분포 사이의 가장 큰 차이를보고 Shapiro Wilk는 두 가지 분산 추정치를 효과적으로 비교합니다. 밀접하게 관련된 Shapiro-Francia는 QQ 플롯에서 제곱 상관의 단조 함수로 간주 될 수 있습니다. 올바르게 기억한다면 Shapiro-Wilk는 주문 통계 간의 공분산도 고려합니다.
[이들보다 더 많은 정규성 테스트가 있음을 명심해야한다.]
hist(replicate(1000,ks.test(scale(rnorm(x)),pnorm)$p.value))
-p- 값이 원래 대로라면 균일하게 보입니다!
간단히 말하면 Shapiro-Wilk 검정은 정규성에 대한 특정 검정이지만 Kolmogorov-Smirnov 검정에서 사용하는 방법 은 더 일반적이지만 덜 강력합니다 (정규도의 귀무 가설을 덜 자주 거부한다는 의미). 두 통계는 모두 정규성을 널 (null)로 간주하고 표본을 기반으로 검정 통계량을 설정하지만 정규 분포의 특징에 다소 민감하게 만드는 방식으로 통계 통계가 서로 다릅니다.
정확히 W (Shapiro-Wilk에 대한 검정 통계량)를 계산 하는 방법은 다소 복잡 하지만 개념적으로 표본 값을 크기별로 배열하고 예상 평균, 분산 및 공분산에 대한 적합도를 측정합니다. 내가 이해 한 것처럼 정규성과 비교 한 이러한 다중 비교는 Kolmogorov-Smirnov 검정보다 더 큰 검정력을 제공합니다.
대조적으로, Kolmogorov-Smirnov 정규성 검정은 예상 누적 분포와 경험적 누적 분포를 비교하여 적합도를 평가하는 일반적인 접근 방식에서 파생됩니다.
따라서 꼬리가 아닌 분포 중심에 민감합니다. 그러나 KS는 수렴입니다 .n은 무한대 경향이 있기 때문에 테스트는 확률 적으로 진정한 답으로 수렴합니다 ( Glivenko-Cantelli Theorem은 여기에 적용되지만 누군가는 나를 교정 할 수 있다고 생각합니다 ). 이것들은이 두 테스트가 정규성 평가에서 다를 수있는 두 가지 방법입니다.