균일 한 합계 분포에 대한 정규 근사 오류


20

정규 분포를 근사화하는 하나의 순진한 방법은 [ 0 , 1 ] 에 균일하게 분포 된 100 IID 랜덤 변수 를 더한 다음 중앙 한계 정리를 사용하여 최근 및 크기를 조정하는 것입니다. ( 참고 : Box-Muller 변환 과 같은보다 정확한 방법이 있습니다 .) IID U ( 0 , 1 ) 랜덤 변수의 합을 균일 합 분포 또는 Irwin-Hall 분포라고 합니다.[0,1]U(0,1)

정규 분포에 의한 균일 한 합계 분포를 근사 할 때 오류가 얼마나됩니까?

이러한 유형의 질문이 IID 랜덤 변수의 합을 근사하기 위해 올 때마다 사람들은 저를 포함하여 Berry-Esseen Theorem을 불러옵니다 .

|Fn(x)Φ(x)|Cρσ3n

여기서 n IID 랜덤 변수 의 재 계산 된 합에 대한 누적 분포 함수이고 , ρ 는 절대 세 번째 중심 모멘트 E | ( X E X ) 3 | , σ는 표준 편차이고, C는 것으로 취해질 수 절대 상수 1 또는 1 / 2 .FnnρE|(XEX)3|σC11/2

불만족 스럽습니다. Berry-Esseen 추정값은 불연속 이항 분포에서 가장 가까우며 대칭 이항 분포의 경우 에서 가장 큰 오차가 가장 큽니다 . 가장 큰 오류는 가장 큰 점프에서 발생합니다. 그러나 균일 한 합계 분포는 점프하지 않습니다.0

수치 테스트에 따르면 오류가 c / 보다 빠르게 축소됩니다. .c/n

사용 , 베리 - Esseen 추정치가 | F N ( X ) - Φ ( X ) | 1C=1/2

|Fn(x)Φ(x)|121321123n0.650n

하는 0.205 , 0.1450.103 , 각각. n = 10 , 20 , 40 의 실제 최대 차이는 각각 약 0.00281 , 0.001390.000692 인 것으로 보이며 , 훨씬 더 작으며 c / 대신 c / n 으로 떨어집니다n=10,20,400.2050.1450.103n=10,20,400.002810.001390.000692c/n .c/n


7
만약에 합의 분포 확장하면 에지 워스 확장 하면하다고 생각 을 균일에서 X 로서 N (보낸 균일 분포는 대칭이므로) c / n 소리가 옳습니다. o 때문에 ( n - 1 )Fn(x)=Φ(x)+n1g(x)+o(n1)xnc/no(n1)용어, 그것은 당신에게 바인딩을 제공하지 않습니다 ...
MånsT

1
고마워, 그것은 다른 많은 분포에서도 패턴을 설명하는 것처럼 보입니다 . c/n
Douglas Zare

답변:


17

하자 IID 될 U ( - B , B ) 무작위 변수들과 정규화 된 합 고려 S N = √을U1,U2,U(b,b) 및 관련 한모금 규범 δ N = 한모금 X R | F N ( X ) - Φ ( X ) |

Sn=3i=1nUibn,
sup 여기서, F , N 의 분포 S의 N
δn=supxR|Fn(x)Φ(x)|,
FnSn .

δn

δn<17.5πn+1π(2π)n+12π3nexp(π2n/24).

Proof. See J. V. Uspensky (1937), Introduction to mathematical probability, New York: McGraw-Hill, p. 305.

This was later improved by R. Sherman to the following.

Lemma 2 (Sherman): The following improvement on the Uspensky bound holds.

δn<17.5πn(π180+17.5πn)eπ2n/24+1(n+1)π(2π)n+12π3neπ2n/24.

Proof: See R. Sherman, Error of the normal approximation to the sum of N random variables, Biometrika, vol. 58, no. 2, 396–398.

The proof is a pretty straightforward application of the triangle inequality and classical bounds on the tail of the normal distribution and on (sinx)/x applied to the characteristic functions of each of the two distributions.


2
+1 Is N=n in Lemma 2?

@Procrastinator: Good catch.
cardinal

1
Thanks! Those references are very helpful. The estimates seem to be within a factor of 2 of the actual value.
Douglas Zare
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.