Kolmogorov-Smirnov를 사용하여 두 가지 실험 분포를 비교할 수 있습니까?


16

Kolmogorov-Smirnov 적합도 검정을 사용하여 두 개의 경험적 분포를 비교하여 하나의 경험적 분포를 사전 지정된 참조 분포와 비교하는 것이 아니라 동일한 기본 분포에서 나온 것으로 보이는지 확인하는 것이 좋습니까?

다른 방법으로 물어 보도록하겠습니다. 한 위치의 분포에서 N 개의 샘플을 수집합니다. 다른 장소에서 M 샘플을 수집합니다. 데이터는 연속적이지만 (각 샘플은 0과 10 사이의 실수) 정규 분포는 아닙니다. 이 N + M 샘플이 모두 동일한 기본 분포에서 나온 것인지 테스트하고 싶습니다. 이 목적으로 Kolmogorov-Smirnov 테스트를 사용하는 것이 합리적입니까?

특히, 나는 N 샘플 에서 경험적 분포 을, M 샘플 에서 경험적 분포 F 1 을 계산할 수 있습니다. 그런 다음 Kolmogorov-Smirnov 검정 통계량을 계산하여 F 0F 1 사이의 거리를 측정 할 수 있습니다 . 즉, 계산 D = sup x | F 0 ( x ) F 1 ( x ) | D를 사용하십시오.F0NF1MF0F1D=supx|F0(x)F1(x)|D적합도에 대한 Kolmogorov-Smirnov 검정에서와 같이 제 검정 통계량입니다. 이것이 합리적인 접근입니까?

적합도에 대한 Kolmogorov-Smirnov 검정이 불연속 분포에는 유효하지 않다는 것을 다른 곳에서 읽었 지만 이것이 의미하는 바 또는 왜 이것이 맞는지 이해하지 못한다는 것을 인정합니다. )

아니면 다른 것을 추천 하시겠습니까?


여기서 @Glen_b의 의견 ( stats.stackexchange.com/questions/362/… )을 기반으로 매개 변수를 추정 할 때 KS 테스트를 사용해서는 안되므로 경험적 분포를 비교하기 위해 KS 테스트를 사용해서는 안됩니다. ).
russellpierce

답변:


19

괜찮습니다. 이를 2- 표본 Kolmogorov-Smirnov 검정이라고 합니다. supnorm에 의한 두 분포 함수의 차이를 측정하는 것은 항상 합리적이지만 공식 테스트를 수행하려면 두 표본이 독립적이며 각각의 iid가 동일한 기본 분포에서 나온다는 가설 하에서 분포를 알고 싶습니다. 일반적인 점근 론 이론에 의존하려면 경험적 분포가 아닌 기본 공통 분포의 연속성이 필요합니다. 자세한 내용은 위의 Wikipedia 페이지를 참조하십시오.

ks.test


8
R에서는 연속성 요구 사항을 제거 하는 부트 스트랩 된 KS 테스트 sekhon.berkeley.edu/matching/ks.boot.html 을 수행 할 수도 있습니다
Dr G

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.