Kolmogorov-Smirnov 테스트가 작동하는 이유는 무엇입니까?


25

2- 표본 KS 테스트에 대해 읽을 때 정확히 무엇을하는지 이해 하지만 왜 작동하는지 이해하지 못합니다 .

즉, 경험적 분포 함수를 계산하고, D- 통계량을 찾고, 임계 값을 계산하고, D- 통계량을 p- 값으로 변환하는 등 둘 사이의 최대 차이를 찾기 위해 모든 단계를 수행 할 수 있습니다.

그러나 왜 이것이 두 배포판에 대해 실제로 말해 줄지 모르겠습니다.

누군가 나에게 당나귀를 뛰어 넘고 얼마나 빨리 도망 가고 속도가 2km / hr 미만이면 귀무 가설을 거부한다고 말했을 수 있습니다. 물론 나는 네가 말한 것을 할 수 있지만, 귀무 가설과는 어떤 관계가 있는가?

2 샘플 KS 테스트가 작동하는 이유는 무엇입니까? ECDF 간의 최대 차이를 계산하는 것은 두 분포가 얼마나 다른지와 어떤 관련이 있습니까?

도움을 주시면 감사하겠습니다. 나는 통계학자가 아니기 때문에 가능한 한 바보라고 가정합니다.


4
CV, Darcy에 오신 것을 환영합니다! 좋은 질문입니다!
Alexis

1
당나귀 위로 점프 ... :)
Richard Hardy

답변:


9

기본적으로이 테스트는 경험적 프로세스와 통계에 대한 가장 중요한 결과 중 하나 인 Glivenko Cantelli 정리의 직접적인 결과와 일치합니다.

n

얼마나 오래? Mmyyeeaa 몰라요. 테스트의 힘은 모호합니다. 나는 실제로 그것을 사용하지 않을 것입니다.

http://www.math.utah.edu/~davar/ps-pdf-files/Kolmogorov-Smirnov.pdf


2
+1 안녕하세요 AdamO! 1에서 2 문장으로 "의심스러운 종류"의 힘을 얻었습니까? 나는 그 관점을 좋아할 것입니다 (시험이 쉽게 "압도적 인"것으로 간주되었습니다).
Alexis

1
F1F2p>0.05p<0.05F1=F2

1
F1F2

2
@Alexis 아니오, 저는 시험 수학에 관심이 없습니다. 사실, 나는 그것이 매우 우아하고 극한 정리 결과가 매우 인상적이라고 생각합니다.
AdamO

2
F1F2

9

우리는 두 개의 독립적 인 일 변량 샘플을 가지고 있습니다 :

X1,X2,...,XNiidFY1,Y2,...,YMiidG,
GF
H0:F(x)=G(x)for all xRH1:F(x)G(x)for some xR.
{Xi}i=1N{Yj}j=1MXiYjFGxFGF(x)G(x)xR


8

직관적 인 조치 :

Kolmogorov-Smirnov 검정은 분포에 따른 관측 순서에 따라 근본적으로 의존합니다. 논리는 두 개의 기본 분포가 동일하면 (샘플 크기에 따라) 두 순서 사이에서 순서가 잘 섞여 있어야한다는 것입니다.

YXD

DXY

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.