Kolmogorov-Smirnov 테스트가 작동하는 이유는 무엇입니까?

25

2- 표본 KS 테스트에 대해 읽을 때 정확히 무엇을하는지 이해 하지만 왜 작동하는지 이해하지 못합니다 .

즉, 경험적 분포 함수를 계산하고, D- 통계량을 찾고, 임계 값을 계산하고, D- 통계량을 p- 값으로 변환하는 등 둘 사이의 최대 차이를 찾기 위해 모든 단계를 수행 할 수 있습니다.

그러나 왜 이것이 두 배포판에 대해 실제로 말해 줄지 모르겠습니다.

누군가 나에게 당나귀를 뛰어 넘고 얼마나 빨리 도망 가고 속도가 2km / hr 미만이면 귀무 가설을 거부한다고 말했을 수 있습니다. 물론 나는 네가 말한 것을 할 수 있지만, 귀무 가설과는 어떤 관계가 있는가?

2 샘플 KS 테스트가 작동하는 이유는 무엇입니까? ECDF 간의 최대 차이를 계산하는 것은 두 분포가 얼마나 다른지와 어떤 관련이 있습니까?

도움을 주시면 감사하겠습니다. 나는 통계학자가 아니기 때문에 가능한 한 바보라고 가정합니다.

— 다시
소스

4

CV, Darcy에 오신 것을 환영합니다! 좋은 질문입니다!

— Alexis

1

당나귀 위로 점프 ... :)

— Richard Hardy

9

기본적으로이 테스트는 경험적 프로세스와 통계에 대한 가장 중요한 결과 중 하나 인 Glivenko Cantelli 정리의 직접적인 결과와 일치합니다.

$n \rightarrow \infty$

얼마나 오래? Mmyyeeaa 몰라요. 테스트의 힘은 모호합니다. 나는 실제로 그것을 사용하지 않을 것입니다.

http://www.math.utah.edu/~davar/ps-pdf-files/Kolmogorov-Smirnov.pdf

— AdamO
소스

2

+1 안녕하세요 AdamO! 1에서 2 문장으로 "의심스러운 종류"의 힘을 얻었습니까? 나는 그 관점을 좋아할 것입니다 (시험이 쉽게 "압도적 인"것으로 간주되었습니다).

— Alexis

1

F_{1}

$F_1$

F_{2}

$F_2$

p > 0.05

$p > 0.05$

p < 0.05

$p < 0.05$

F_{1} = F_{2}

$F_1 = F_2$

1

F_{1}

$F_{1}$

\neq F_{2}

$\ne F_{2}$

2

@Alexis 아니오, 저는 시험 수학에 관심이 없습니다. 사실, 나는 그것이 매우 우아하고 극한 정리 결과가 매우 인상적이라고 생각합니다.

— AdamO

2

F_{1}

$F_1$

F_{2}

$F_2$

9

우리는 두 개의 독립적 인 일 변량 샘플을 가지고 있습니다 :

\begin{aligned} X_{1}, X_{2}, . . ., X_{N} & \overset{i i d}{\sim} F \\ Y_{1}, Y_{2}, . . ., Y_{M} & \overset{i i d}{\sim} G, \end{aligned}

$\begin{align} X_1,\,X_2,\,...,\,X_N&\overset{iid}{\sim}F\\ Y_1,\,Y_2,\,...,\,Y_M&\overset{iid}{\sim}G, \end{align}$

G

$G$

F

$F$

\begin{aligned} H_{0} & : F (x) = G (x) for all x \in R \\ H_{1} & : F (x) \neq G (x) for some x \in R . \end{aligned}

$\begin{align} H_0&:F(x) = G(x)\quad\text{for all } x\in\mathbb{R}\\ H_1&:F(x) \neq G(x)\quad\text{for some } x\in\mathbb{R}. \end{align}$

{X_{i}}_{i = 1}^{N}

$\{X_i\}_{i=1}^N$

{Y_{j}}_{j = 1}^{M}

$\{Y_j\}_{j=1}^M$

X_{i}

$X_i$

Y_{j}

$Y_j$

F

$F$

G

$G$

x

$x$

F

$F$

G

$G$

F (x) \neq G (x)

$F(x)\neq G(x)$

x \in R

$x\in\mathbb{R}$

— jcz
소스

8

직관적 인 조치 :

Kolmogorov-Smirnov 검정은 분포에 따른 관측 순서에 따라 근본적으로 의존합니다. 논리는 두 개의 기본 분포가 동일하면 (샘플 크기에 따라) 두 순서 사이에서 순서가 잘 섞여 있어야한다는 것입니다.

$Y$ $X$ $D$

$D$ $X$ $Y$

— 알렉시스
소스