표본의 CDF가 균일하게 분포 된 이유


17

여기 에 샘플 가 주어진 것을 읽었습니다 . . . ,X1,X2,...,Xn cdf 를 사용한 연속 분포로부터의 X n 에서, 대응하는 샘플 은 표준 균일 분포를 따른다.FXUi=FX(Xi)

파이썬에서 질적 시뮬레이션을 사용하여 이것을 확인했으며 관계를 쉽게 확인할 수있었습니다.

import matplotlib.pyplot as plt
import scipy.stats

xs = scipy.stats.norm.rvs(5, 2, 10000)

fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
    scipy.stats.norm.cdf(xs, 5, 2),
    bins=50
)
axes[1].set_title("CDF(samples)")

다음 플롯 결과 :

정규 분포의 표본과 표본의 cdf를 보여주는 그림.

왜 이런 일이 일어나는지 알 수 없습니다. 나는 그것이 CDF의 정의와 관련이 있고 PDF와의 관계와 관련이 있다고 생각하지만, 뭔가 빠졌습니다 ...

누군가가 주제에 대한 독서를 지적하거나 주제에 대한 직관을 얻도록 도울 수 있다면 고맙겠습니다.

편집 : CDF는 다음과 같습니다

표본 분포의 CDF


2
의 cdf를 계산합니다 . FX(X)
Zhanxiong

2
시뮬레이션에 대한 모든 책에서이 특성 (연속 rv)에 대한 증거를 찾을 수 있습니다. 이는 역 cdf 시뮬레이션 방법의 기초이기 때문입니다.
시안

2
또한 Google-ing 확률 적분 변환을
Zachary Blumenfeld

1
@ Xi'an 결론은 연속적인 랜덤 변수에 대해서만 유효하다는 것을 지적하는 것이 좋습니다. 때때로이 결과는 불연속 랜덤 변수에 실수로 사용됩니다. 반면에, 많은 증거가 단계를 포함한다주의 하는 엄격한 단순성 가정 F 또한 너무 강한 가정이다. 다음 링크는이 주제에 대한 엄격한 요약을 제공합니다. people.math.ethz.ch/~embrecht/ftp/generalized_inverse.pdfP(F(X)x)=P(XF1(x))F
Zhanxiong

@ Zhanxiong 필요한 유일한 조건 은 그것이 càdlàg이라는 것입니다. F
AdamO

답변:


19

가 계속 증가하고 있다고 가정합니다 . Z = F X ( X )를 정의 하고 Z[ 0 , 1 ]의을가 집니다 . 이어서 F Z ( X ) = P ( F X ( X ) X ) = P ( X F - 1 X ( X ) ) = F X ( F -FXZ=FX(X)Z[0,1]

FZ(x)=P(FX(X)x)=P(XFX1(x))=FX(FX1(x))=x.

반면에 [ 0 , 1 ]의 값을 취하는 균일 랜덤 변수 인 경우 F U ( x ) = R f U ( u )U[0,1]

FU(x)=RfU(u)du=0xdu=x.

FZ(x)=FU(x)x[0,1]


Z가 균일 한 분포 (0, 1)를 따르는가?
StatsSorceress

Z(0,1).

8

F(x)F(x)FxF1x=F1(p)xpFF1=λF1F

Fa<bP(F1(a)<x<F1(b))=P(a<F(X)<b)=ba


Y=F(X)
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.