Shapiro-Wilk 정규성 검정과 Kolmogorov-Smirnov 정규성 검정의 차이점은 무엇입니까?


답변:


23

Kolmogorov-Smirnov가 완전히 지정된 분포이기 때문에 두 값을 실제로 비교할 수도 없습니다. 따라서 정규성을 테스트하는 경우 평균과 분산을 지정해야합니다. 데이터에서 추정 할 수는 없습니다 * Shapiro-Wilk는 지정되지 않은 평균과 분산을 갖는 정규성을위한 것입니다.

* 또한 추정 된 매개 변수를 사용하여 표준화 할 수없고 표준 정규성을 테스트 할 수 없습니다. 그것은 실제로 같은 것입니다.

비교하는 한 가지 방법은 Shapiro-Wilk에 정규의 지정된 평균 및 분산에 대한 검정 (일부 방식으로 검정을 결합)을 보충하거나 KS 표를 모수 추정에 맞게 조정하여 (더 이상 분포가 아님) 보완하는 것입니다. -비어 있는).

그러한 시험이 있습니다 (추정 매개 변수가있는 Kolmogorov-Smirnov와 동일)-Lilliefors 시험; 정규성 테스트 버전은 Shapiro-Wilk와 유효하게 비교 될 수 있습니다 (일반적으로 전력이 더 낮습니다). 보다 경쟁력있는 Anderson-Darling 테스트 (비교가 유효하려면 매개 변수 추정에 대해서도 조정되어야 함).


그들이 테스트하는 것-KS 테스트 (및 Lilliefors)는 경험적 CDF와 지정된 분포 사이의 가장 큰 차이를보고 Shapiro Wilk는 두 가지 분산 추정치를 효과적으로 비교합니다. 밀접하게 관련된 Shapiro-Francia는 QQ 플롯에서 제곱 상관의 단조 함수로 간주 될 수 있습니다. 올바르게 기억한다면 Shapiro-Wilk는 주문 통계 간의 공분산도 고려합니다.

30>60

[이들보다 더 많은 정규성 테스트가 있음을 명심해야한다.]


이것은 흥미로운 답변이지만 연습으로 제곱하는 방법을 이해하는 데 약간의 어려움이 있습니다. 어쩌면 이것들은 다른 질문이어야하지만 KS 테스트에서 모수 추정을 무시한 결과는 무엇입니까? 이는 Lillefors 테스트가 데이터에서 파서가 추정 된 잘못 수행 된 KS보다 전력이 적다는 것을 의미합니까?
russellpierce

@rpierce-추정 된 모수를 알려진 것으로 취급 할 때의 주요 영향은 실제 중요도 수준 (따라서 전력 곡선)을 고려했을 때의 실제 수준 (Llielies와 마찬가지로)을 현저히 낮추는 것입니다. 즉, Lilliefors는 매개 변수 추정에 대한 KS의 '권리'이며 KS보다 실질적으로 더 나은 검정력을 갖습니다. 반면에 Lilliefors는 Shapiro-Wilk 테스트보다 훨씬 나쁜 힘을 가지고 있습니다. 간단히 말해서 KS는 특히 강력한 테스트가 아니며 매개 변수 추정을 무시함으로써 악화시킵니다.
Glen_b-복지 주 모니카

우리가 '더 나은 힘'과 '더 나쁜 힘'이라고 말할 때 사람들이 일반적으로 흥미로운 대안으로 간주하는 것에 반대하는 힘을 말하는 것을 명심하십시오.
Glen_b-복지 주 모니카

1
나는 힘의 곡선을 보았습니다. 저는 그것을 낮추거나 올리는 것이 무엇을 의미하는지 생각하지 않았고 대신 신은 두 번째 의견 시작에 대해 생각했습니다. 어쨌든 나는 뒤 틀렸고 당신이 '더 나은'힘은 그것이 있어야 할 곳에 힘 곡선을 갖는 것을 의미한다고 생각했습니다. 어쩌면 우리는 KS에서 부정하고 비현실적인 힘을 얻었을 것입니다. 왜냐하면 우리는 추정에 대해 불이익을 받았어야하는 매개 변수를 전달했기 때문입니다. .
russellpierce

1
이전에 이러한 의견을 어떻게 놓쳤는 지 확실하지 않지만 예, KS 테스트를 사용하여 알려진 / 지정된 것처럼 추정 된 매개 변수를 사용하여 계산 된 p- 값은 너무 높은 경향이 있습니다. R에서 시도하십시오 : hist(replicate(1000,ks.test(scale(rnorm(x)),pnorm)$p.value))-p- 값이 원래 대로라면 균일하게 보입니다!
Glen_b-복지 주 모니카

24

간단히 말하면 Shapiro-Wilk 검정은 정규성에 대한 특정 검정이지만 Kolmogorov-Smirnov 검정에서 사용하는 방법 은 더 일반적이지만 덜 강력합니다 (정규도의 귀무 가설을 덜 자주 거부한다는 의미). 두 통계는 모두 정규성을 널 (null)로 간주하고 표본을 기반으로 검정 통계량을 설정하지만 정규 분포의 특징에 다소 민감하게 만드는 방식으로 통계 통계가 서로 다릅니다.

정확히 W (Shapiro-Wilk에 대한 검정 통계량)를 계산 하는 방법은 다소 복잡 하지만 개념적으로 표본 값을 크기별로 배열하고 예상 평균, 분산 및 공분산에 대한 적합도를 측정합니다. 내가 이해 한 것처럼 정규성과 비교 한 이러한 다중 비교는 Kolmogorov-Smirnov 검정보다 더 큰 검정력을 제공합니다.

대조적으로, Kolmogorov-Smirnov 정규성 검정은 예상 누적 분포와 경험적 누적 분포를 비교하여 적합도를 평가하는 일반적인 접근 방식에서 파생됩니다.

대체 텍스트

따라서 꼬리가 아닌 분포 중심에 민감합니다. 그러나 KS는 수렴입니다 .n은 무한대 경향이 있기 때문에 테스트는 확률 적으로 진정한 답으로 수렴합니다 ( Glivenko-Cantelli Theorem은 여기에 적용되지만 누군가는 나를 교정 할 수 있다고 생각합니다 ). 이것들은이 두 테스트가 정규성 평가에서 다를 수있는 두 가지 방법입니다.


3
게다가 ... Shapiro-Wilk의 검정은 작은 표본에서 정규성에서 벗어나는 것을 추정 할 때 자주 사용됩니다. 좋은 대답, 존! 감사.
aL3xa

+1, KS에 대한 두 가지 다른 참고 사항 : 모든 주요 분포에 대해 테스트하는 데 사용할 수 있습니다 (SW는 정규성 에만 해당 ). 낮은 전력 큰 샘플을 가진 좋은 일 있습니다.
gung-Monica Monica 복원

저전력은 어떻게 좋은가요? 타입 I이 동일하게 유지되는 한 항상 더 높은 전력이 더 나을까요? 게다가 KS는 일반적으로 덜 강력하지 않고 렙 토쿠 르토 시스에만 작용할까요? 예를 들어 KS는 유형 1 오류를 적절히 증가시키지 않으면 서 왜곡에 훨씬 더 강력합니다.
John

Kolmogorov-Smirnov는 완전 분포를위한 것입니다. 샤피로 윌크는 아닙니다. 그것들을 비교할 수 있도록 조정하는 즉시 더 이상 하나 또는 다른 테스트가 없기 때문에 비교할 수 없습니다 .
Glen_b-복지 모니카

세부적인 방식으로 유용한 것을 추가 할 수있는 경우이 시뮬레이션 연구를 찾았습니다. 위와 동일한 일반적인 결론 : Shapiro-Wilk 테스트가 더 민감합니다. ukm.my/jsm/pdf_files/SM-PDF-40-6-2011/15%20NorAishah.pdf
Nick Stauner
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.