특징적인 기능을 사용하지 않는 중앙 제한 정리 증명


11

CLT가 특징적인 기능을 사용하지 않는 더 간단한 방법에 대한 증거가 있습니까?

아마 Tikhomirov 또는 Stein의 방법일까요?

자체적으로 포함 된 것이 대학생 (수학 또는 물리학의 첫 해)에게 설명 할 수 있고 한 페이지 미만을 차지합니까?


2
stats.stackexchange.com/a/3904/919 에서 그러한 기본적인 접근 방식을 스케치했습니다 . 아마도 누적 생성 함수를 사용하는 것이 가장 간단한 방법 일 것입니다. "단순한"것은 아마도 "더 많은 기본"을 읽는 것입니다.
whuber

2
특징적인 기능을 사용할 때보 다 더 제한적인 조건에서 대신 순간 생성 기능을 사용할 수 있습니다 (실제로 처음 본 CLT는이 형식이었습니다). 그러나 박람회는 상당히 유사합니다.
Glen_b-복지 주 모니카

@Glen_b 나는 순간이 더 쉬울 것이라고 생각했다. 어쨌든 다른 사람이 다른 데모를 게시하는 경우를 대비하여 질문을 열어 두겠습니다.
skan

증명으로서, 실제로는 쉽지 않습니다 (cfs를 가진 증명은 mgfs를 가진 증명과 같은 형식으로 작성 될 수 있습니다) . 와 관련된 기능에 대한 배경 지식이없는 학생들에게는 더 좋습니다. 즉, 새로운 개념을 도입하는 것을 절약 할 수는 있지만, 그러한 개념이 이미있는 경우 이미 cfs를 사용하여 해당 문장의 증거를 증명하는 것은 실제로 어렵지 않습니다 (더 일반적이지만). 이것이 더 나은지 여부는 당신이 다루는 학생들에 달려 있습니다. i
Glen_b-복지 주 모니카

필자는 1 년차 대학원 통계 교수 가 다양한 확률 모델에서 으로 평균의 샘플링 분포를 보여줌으로써 CLT의 시각적 인 "증거"를 제공했다고 회상 합니다. 물론 정상은 경향이 없었지만 지수, 베르누이 및 다양한 꼬리가 많은 분포는 모두 증가마다 시각적으로 친숙한 모양으로 "반올림"되었습니다 . nn=10,100,1000n
AdamO

답변:


6

Stein의 방법으로 증명할 수 있지만 증거가 기본이라면 논쟁의 여지가 있습니다. Stein 방법의 장점은 본질적으로 무료로 약간 약한 형태의 Berry Esseen 경계를 얻는 것입니다. 또한 Stein의 방법은 흑 마법에 불과합니다! 이 링크의 섹션 6 에서 증명의 설명을 찾을 수 있습니다 . 링크에서 CLT의 다른 증거도 찾을 수 있습니다.

간략한 개요는 다음과 같습니다.

1) 부품과 정규 분포 밀도에 의한 간단한 통합을 사용하여 지속적으로 차별화 할 수있는 모든 iff 대한 이 분포 합니다. 보여주기가 더 쉽습니다 법선은 결과를 나타내며 대화를 표시하기가 조금 더 어려우나, 아마도 믿음으로 받아 들일 수 있습니다.A N ( 0 , 1 ) AEf(A)Xf(A)=0AN(0,1)A

2)보다 일반적으로, 경계를 갖는 연속적으로 차별화 할 수있는 모든 대해 분포에서 은 으로 수렴합니다 . 여기서 증명은 몇 가지 트릭으로 부품별로 통합하는 것입니다. 구체적으로, 우리는 분포의 수렴이 모든 경계 연속 함수 대해 와 동일하다는 것을 알아야합니다 . 고정 하면 다음을 재구성하는 데 사용됩니다.f f , f ' X n N ( 0 , 1 ) E g ( X n ) E g ( A ) g gEf(Xn)Xnf(Xn)0ff,fXnN(0,1)Eg(Xn)Eg(A)gg

Eg(Xn)Eg(A)=Ef(Xn)Xnf(Xn),

여기서 기본적인 ODE 이론을 사용하여 를 풀고 가 훌륭 하다는 것을 보여줍니다 . 따라서 우리가 그러한 멋진 찾을 수 있다면 , rhs는 0으로 가정하고 따라서 왼쪽도 마찬가지입니다.f ffff

3) 마지막으로 대한 중앙 한계 정리를 증명합니다 여기서 는 평균 0과 분산 1을 갖는 iid입니다. 모든 대해 다음과 같은 찾습니다 . XigfYn:=X1++XnnXigf

Eg(Xn)Eg(A)=Ef(Xn)Xnf(Xn).

6

고등학교 때 어떻게합니까?

밀도가 인 확률 분포를 평균과 분산을 구하십시오 . 그런 다음 형식 의 랜덤 변수 를 사용하여 근사값을 구하십시오 . 여기서 는 Bernoulli 랜덤 변수 입니다 . 당신은 볼 수 있습니다 및 .μ (X) , σ (2) , X , Z , Z = μ X - σ X + 2 σ X ξ , ξ P = 1 / 2 μ Z = μ X σ 2 Z는 = σ 2 Xf(x)μx,σx2z

z=μxσx+2σxξ,
ξp=1/2μz=μxσz2=σx2

이제 합계

Sn=i=1nzi
=n(μxσx)+2σxi=1nξi

여기서 이항 분포를 인식 할 수 있습니다 : , 여기서 . 정규 분포의 형태로 수렴하는 것을 확인하기 위해 특성 함수가 필요하지 않습니다 .η=i=1nξiηB(n,1/2)

따라서 어떤면에서 Bernoulli는 모든 분포에 대해 가장 정확한 근사치이며 심지어 정상으로 수렴한다고 말할 수 있습니다.

예를 들어 모멘트가 정상과 일치 함을 보여줄 수 있습니다. 변수를 살펴 보자 :y=(Sn/nμx)n

y=σx(1+2η/n)n

평균과 분산이 무엇인지 봅시다 : VR[Y]=σ 2 X VR[2η/N]N=4σ 2 X /NN(1/4)=σ 2 X

μy=σx(1+2(n/2)/n)n=0
Var[y]=σx2Var[2η/n]n=4σx2/nn(1/4)=σx2

왜도 및 과잉 첨도는 로 0으로 수렴되며 , 이항에 대해 알려진 공식을 연결하면 쉽게 표시 할 수 있습니다.n


흥미 롭군 이 아이디어를 완전한 증거로 바꿀 수 있습니까?
Elvis

@Elvis, 나는 몇 년 전에 나 자신처럼 생각하려고 노력했지만 증거에 그다지 많지 않았습니다. 내가 생각한 것 중 하나는 연속 분포를 베르누이의 조합으로 나타내는 것이지만 가능한지 확실하지 않은 것입니다.
Aksakal

위에서 쓴 내용이 훨씬 나을 수 있습니다. 분포를 근사화 할 필요가 없습니다. 두 개의 서로 다른 값을 취하는 변수에 의한 대략적인 근사가 작업을 수행합니다.
Elvis

즉, 정규 근사의 정확도에 대한 한계를 도출 할 수 있다면 가능합니다. 마찬가지로 정규 근사값은 축척 된 Bernoulli의 경우와 마찬가지로 원래 분포에 적합합니다. 또는 더 약한 것이지만 여전히 결론을 내릴 수 있습니다.
Elvis
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.