Kolmogorov-Smirnov 검정은 이산 분포에서 유효합니까?


29

샘플을 비교하고 샘플이 분리 된 개별 분포로 분포하는지 확인하고 있습니다. 그러나 Kolmogorov-Smirnov가 적용되는지 확실하지 않습니다. Wikipedia 는 그렇지 않은 것으로 보입니다. 그렇지 않은 경우 표본 분포를 어떻게 테스트 할 수 있습니까?


+1 실수로 KS 테스트를 (많은) 관계로 데이터에 잘못 적용한 예는 real-statistics.com/non-parametric-tests/goodness-of-fit-fit 의 Excel 통계 애드온에 대한 도움말 페이지에 있습니다. 테스트 / ... . 여러 가지 이유로 결과가 잘못되었습니다. 조심스러운 강사!
whuber

불연속 널 분포에 대한 KS 테스트가 가능합니다 : en.wikipedia.org/wiki/…
Astrid

답변:


14

불연속 배포에는 적용되지 않습니다. 참조 http://www.itl.nist.gov/div898/handbook/eda/section3/eda35g.htm을 예를 들어.

카이-제곱 적합도 검정을 사용할 수없는 이유가 있습니까? 자세한 정보 는 http://www.itl.nist.gov/div898/handbook/eda/section3/eda35f.htm 을 참조 하십시오 .


침입으로 유감이지만, 왜 지속적인 배포에만 적용되는지 이해하지 못합니다 (KS 및 기타 유효성 검사 테스트). 누군가 나에게이 사실을 설명 할 수 있습니까?
Maurizio

6
@Maurizio-KS 검정 통계량은 모든 연속 분포 에서 동일한 분포를 갖지만 실제 분포가 연속적이지 않고 분포가 연속적이라고 가정 할 경우 수준 검정 을 구성하려고 시도합니다. α 보다 작아야 합니다. (참조 Lehmann & Romano Testing Statistical Hypotheses, Third Edition , p. 584). KS 통계를 기반으로 레벨 α 테스트를 계속 수행 할 수 있지만 시뮬레이션과 같은 임계 값을 얻기위한 다른 방법을 찾아야합니다. ααα
DavidR

별도의 KS 테스트가 있습니다 : stat.yale.edu/~jay/EmersonMaterials/DiscreteGOF.pdf
Astrid

7

통계에서 종종 그렇듯이, 그것은 당신의 의미에 달려 있습니다 .

  1. "이산 분포에서 추출한 표본에 대해 검정 통계량을 계산 한 다음 표준 테이블을 검색합니다"를 선택한 경우 선택한 유형보다 실제 유형 I 오류율이 낮을 수 있습니다 (아마도 훨씬 낮음).

    분포가 얼마나 이산 적인가에 달려 있습니다. 한 결과의 확률이 상당히 낮 으면 (따라서 데이터의 묶인 값 비율이 낮을 것으로 예상 됨) 크게 문제가되지 않습니다. 많은 사람들이 5를 실행하는 데 문제가 없을 것입니다 4.5 %에서 % 테스트를합니다. 예를 들어 [1,1000]에서 이산 유니폼을 테스트하는 경우 걱정할 필요가 없습니다.

    그러나 값이 묶일 확률이 높으면 유형 I 오류율에 대한 영향을 표시 할 수 있습니다. 0.05를 원할 때 0.005의 유의 수준을 얻는다면 이는 그에 따라 힘에 영향을 미치기 때문에 문제가 될 수 있습니다.

  2. 대신 "이산 분포에서 추출한 표본에 대해 검정 통계량을 계산 한 다음 적절한 임계 값을 사용하거나 내 상황에 적합한 p- 값을 계산합니다"(예 : 순열 검정을 통해)를 의미하는 경우 물론 테스트 통계 자체의 이산 성까지 올바른 유형 I 오류율을 얻을 수 있다는 점에서 확실히 유효합니다 . (일반적인 경우와 마찬가지로 특정 목적에 맞는 더 나은 테스트가있을 수 있지만)

    검정 통계량 자체의 분포는 더 이상 분포가 없지만 순열 검정은이 문제를 피합니다.

따라서 때로는 불연속 분포에서도 표준 테이블을 사용하는 것이 좋으며, 좋지 않은 경우에도 문제와 함께 사용하는 임계 값 / p- 값만큼 테스트 통계가 그리 크지 않습니다.


평소처럼 Glen은 고품질입니다. 그러나 아마도 그것에 대한 가장 좋은 부분은 당신이 통계에 관한이 글에서 내가 만든 농담을 실제로 "그것에 달려있다"고 말한 것입니다! stats.stackexchange.com/questions/182442/...
Sycorax는 분석 재개 모니카 말한다

1
우연이 아닌 @ user777; 그것은 나를 즐겁게했고, 나는이 질문을 "잘, 그것은 의존한다"라고 읽었을 때 생각하고 있었다. 그래서 나는 당신의 포스트를 반향하기 위해 그것을 명시 적으로 말해야했다.
Glen_b-복지 주 모니카

1
내 저녁은 더 좋아졌다. 건배!
Sycorax는 Reinstate Monica가

2

엑스에프에프(엑스)엑스엑스에프(엑스)=엑스

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.