또 다른 중심 제한 정리 문제


11

하자 독립적 베르누이 랜덤 변수들의 시퀀스 일 집합 보여 표준 정규 분포 변수로 수렴 등이 무한대.{Xn:n1}

P{Xk=1}=1P{Xk=0}=1k.
Sn=k=1n(Xk1k), Bn2=k=1nk1k2
SnBnZn

내 시도는 그러므로 우리가 존재 보여줄 필요가, 아프 노프 CLT를 사용하는 것입니다 등, 그 δ>0

limn1Bn2+δk=1nE[|Xk1k|2+δ]=0.

따라서 δ=1

k=1nE|Xkk1|3=k=1n(1k3k2+4k32k4)
Bn3=(k=1n1k1k2)(k=1n1k1k2)

컴퓨터에서 큰 n을 평가하여 k=1nE|Xkk1|3Bn3 같은 n . 그러나 Bn3B_n ^ 2 보다 빠르게 증가 Bn2하므로 k=1nE|Xkk1|3Bn30 입니다. 이 수렴이 확실하다는 것을 증명할 수 있습니까?


7
이것은 Patrick Billingsley 의 확률과 측정 의 예 27.3입니다 .
Zhanxiong

답변:


10

누적 생성 함수의 속성을 활용하여 (중앙 한계 정리의 표준 증거에서와 같이) 첫 번째 원칙과 기본 결과에서이 결과를 설명하는 것이 도움이 될 수 있습니다 . 대한 일반화 된 고조파 숫자 의 성장 속도를 이해해야합니다 이러한 성장률은 적분과 비교하여 잘 알려져 있으며 쉽게 얻을 수 있습니다 . 이들은 수렴 하고 그렇지 않으면 대수적으로 분기 합니다.

H(n,s)=k=1nks
s=1,2,.1nxsdxs>1s=1

및 보자 . 정의상, 의 누적 생성 함수 (cgf) 는n21kn(Xk1/k)/Bn

ψk,n(t)=logE(exp(Xk1/kBnt))=tkBn+log(1+1+exp(t/Bn)k).

주위 의 확장으로 얻은 오른쪽의 계열 확장은 다음 과 같은 형식을 취합니다.log(1+z)z=0

ψk,n(t)=(k1)2k2Bn2t2+k23k+26k3Bn3t3++kj1±(j1)!j!kjBnjtj+.

분수의 분자는 과 함께 다항식입니다 . 로그 확장은 이면이 확장은 절대적으로 수렴합니다.kkj1|1+exp(t/Bn)k|<1

|exp(t/Bn)1|<k.

( 인 경우, 모든 곳에서 수렴합니다.) 고정 된 및 증가하는 값의 , 의 (분명한) 발산 은 절대 수렴 영역이 임의로 커짐을 의미합니다. 따라서, 임의의 고정 된 및 충분히 큰 ,이 팽창은 절대적으로 수렴한다.k=1knBntn

충분히 큰 들어 , 그 후, 우리는 따라서 각각의 합계 수 위에 의 힘에 의해 용어 용어 의 CGF 수득 ,nψk,nktSn/Bn

ψn(t)=k=1nψk,n(t)=12t2++1Bnj(k=1n(k1±(j1)!kj))tjj+.

한 번에 이상의 합계로 항을 취하려면 다음 식에 비례하는 식을 평가해야합니다.k

b(s,j)=1Bnjk=1nks

용 과 . 서론에 언급 된 일반화 된 고조파 수의 점근선을 사용하면j3s=1,2,,j

Bn2=H(n,1)H(n,2)log(n)

b(1,j)(log(n))1j/20

및 ( )s>1

b(s,j)(log(n))j/20

같은 큰 성장한다. 결과적으로 넘어 의 확장에있는 모든 항은 0으로 수렴하고, 는 값에 대해 로 수렴합니다 . CGF에서의 수렴 특성 함수의 융합을 의미하기 때문에, 우리는 결론에서 레비 연속성 정리 것을 그 CGF 인 랜덤 변수 접근 , 표준 정규 변수 : QED를 .nψn(t)t2ψn(t)t2/2tSn/Bnt2/2


이 분석은 수렴이 얼마나 섬세한지를 밝혀냅니다 . 중앙 한계 정리의 여러 버전에서 의 계수 는 ( )이며 여기서 계수는 오직 : 수렴이 훨씬 느리다 이런 의미에서 표준화 된 변수의 시퀀스는 "거의"거의 정상이됩니다.tjO(n1j/2)j3O(((log(n))1j/2)

일련의 시뮬레이션에서이 느린 수렴을 볼 수 있습니다. 히스토그램 은 4 개의 값에 대해 독립적 반복을 표시 합니다. 빨간색 곡선은 시각적 참조를위한 표준 정규 밀도 함수의 그래프입니다. 분명히 정규성에 대한 점진적인 경향이 있지만, (여기서 은 여전히 ​​상당한 크기 임)에도 비대칭 성이 있습니다. ( 이 샘플에서는 와 동일 ). (이 히스토그램의 왜도가 에 가깝다는 것은 놀라운 일이 아닙니다. cgf에서 항이 정확히 그렇기 때문입니다.)105nn=1000(log(n))1/20.380.35(log(n))1/2t3

그림 : n = 30, 100, 300, 1000에 대한 히스토그램

다음은 R추가 실험을 원하는 사람들을위한 코드입니다.

set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
  B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
  x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
  z <- colSums(x - 1/(1:n)) / B.n
  hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
  curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}

6

이미 좋은 대답이 있습니다. 자신의 증명도 작성하려면 다음과 같이 논쟁 할 수 있습니다.

이후 모두 수렴 및 대한 발산 ( 여기 ), 우리는 기록 할 수있다k=1n1/kii>1i=1

S(n):=k=1n(1k3k2+4k33k4)=k=1n1k+O(1).

같은 주장으로

Bn2=k=1n1k+O(1).

결과적으로 이므로S(n)/Bn2=O(1)

S(n)/Bn3=O(1)(Bn2)1/20,

우리가 보여주고 싶었던 것입니다.


2

분포가 의존하는 경우 임의 변수는 동일하게 분포되지 않습니다 .)k

또한 나는 당신의 표기법을 다음과 같이 사용하지 않을 것입니다 :Bn

  • 대문자는 일반적으로 임의의 변수를 위해 예약되어 있습니다.
  • 이것은 분산의 합일 뿐이므로 기호 와 관련된 표기법을 사용하여 이를 분명히합니다.σ

그런 다음 질문이 운동인지 연구인지, 어떤 도구를 사용할 수 있는지 모르겠습니다. 알려진 이론을 다시 증명하지 않으려는 경우 독립 비 식별 분포이지만 균일하게 제한되는 RV에 대한 중심 한계 정리라고 말하고 하루에 전화하십시오. 나는 좋은 소스가 없지만 /mathpro/29508/is-there-a-central-limit-theorem-을 보면 소스를 찾기가 너무 어렵지 않아야합니다. 비 한정적으로 분산 된 랜덤 .

편집 : 내 나쁜, 물론 균일 한 경계 조건이 충분하지 않습니다.

k=1nσk2
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.