중심 한계 정리가 가지고 있지 않은 예가 있습니까?


32

위키 백과는 말합니다-

확률 이론에서 CLT (Central Limit Theorem) 는 대부분의 상황 에서 독립적 인 랜덤 변수를 추가 할 때 원래 변수 자체가 아닌 경우에도 적절하게 정규화 된 합이 정규 분포 (비공식적으로 "벨 곡선")를 향하는 경향이 있음을 확립합니다. 정규 분포 ...

"대부분의 상황에서"라고 말할 때, 중앙에서 정리가 작동하지 않는 상황은 무엇입니까?

답변:


33

이를 이해하려면 먼저 중앙 한계 정리의 버전을 명시해야합니다. 다음은 중심 한계 정리의 "일반적인"진술입니다.

Lindeberg–Lévy CLT. 가 및 인 iid 임의 변수의 시퀀스 라고 가정하십시오 . 보자 . 그 다음으로 무한대에 가까워, 랜덤 변수 정규 분포에 수렴 , 즉엑스1,엑스2,이자형[엑스나는]=μV에이아르 자형[엑스나는]=σ2<에스: =엑스1++엑스(에스μ)(0,σ2)

((1나는=1엑스나는)μ)  (0,σ2).

그렇다면 이것이 비공식적 인 설명과 어떻게 다릅니 까? 그리고 그 차이는 무엇입니까? 비공식적 설명과이 설명 사이에는 몇 가지 차이점이 있으며, 그 중 일부는 다른 답변에서 논의되었지만 완전히 설명되지는 않았습니다. 따라서 우리는 이것을 세 가지 구체적인 질문으로 바꿀 수 있습니다.

  • 변수가 동일하게 분포되어 있지 않으면 어떻게됩니까?
  • 변수에 무한 분산 또는 무한 평균이 있으면 어떻게됩니까?
  • 독립성은 얼마나 중요합니까?

한 번에 하나씩 복용하면

동일하게 분포되지 않음 , 가장 일반적인 결과는 Lindeberg 및 Lyaponov 버전의 중앙 한계 정리입니다. 기본적으로 표준 편차가 지나치게 커지지 않는 한 적절한 중심 한계 정리를 얻을 수 있습니다.

랴푸 노프 CLT. [5] 가 각각 유한 한 예상 값 및 분산 를 갖는 독립적 인 랜덤 변수의 시퀀스 라고 가정 하십시오.μ i σ 2 s 2 n =n i = 1 σ 2 i엑스1,엑스2,μ나는σ2에스2=나는=1σ나는2

일부 경우 Lyapunov의 조건 에 만족하면 은 n이 무한대로 가면서 표준 정규 확률 변수로 분포가 수렴합니다.Lim n 1δ>0Xi-μi/snlimn1sn2+δi=1nE[|Xiμi|2+δ]=0Xiμi/s

1sni=1n(Xiμi) d N(0,1).

무한 분산 중앙 한계 정리와 유사한 정리는 무한 분산을 갖는 변수에 대해 존재하지만 조건은 일반적인 중앙 한계 정리보다 훨씬 더 좁습니다. 기본적으로 확률 분포의 꼬리는 대해 대해 점근선이어야합니다 . 이 경우, 적절한 스케일 된 서먼 드는 Levy-Alpha 안정적인 분포로 수렴됩니다 .|x|α10<α<2

독립성의 중요성 비 독립적 시퀀스에 대한 많은 다른 중심 한계 정리가 있습니다. 그것들은 모두 매우 맥락 적입니다. 배트맨이 지적했듯이 Martingales에게는 하나가 있습니다. 이 질문은 진행중인 연구 분야이며, 관심있는 특정 상황에 따라 다양한 변형이 있습니다. 이 질문 수학 거래소에이 질문에 관련된 다른 게시물입니다.Xi


2
인용 시스템으로 인해 생각했던 수식에서 길잃은 ">"를 제거했습니다. 의도 한 경우 편집 내용을 되돌릴 수 있습니다.
Silverfish

삼각 배열 CLT는 아마도 언급 된 것보다 더 대표적인 CLT 일 것입니다. 독립적이지 않은 경우, martingale CLT는 합리적으로 일반적으로 사용되는 사례입니다.
배트맨

@ 배트맨, 삼각 배열 CLT의 예는 무엇입니까? 내 답변을 수정하고 추가하려면 언제든지 수정하십시오. 나는 그것에 익숙하지 않다.
John


1
"표준 편차가 너무 크게 증가하지 않는 한"또는 축소 (예 : )σi2=σi12/2
leonbloy

21

이전에 답변을 받았다고 확신하지만 여기에 다른 질문이 있습니다.

중심 한계 정리의 여러 버전이 있으며, 가장 일반적인 것은 임의의 확률 밀도 함수가 주어지면 변수의 합은 평균 값의 합과 같은 평균 값과 분산이 합입니다. 개별 차이의.

매우 중요하고 관련된 제약은 주어진 PDF의 평균과 분산이 존재해야하며 유한해야한다는 것입니다.

따라서 평균 값이나 분산없이 PDF를 가져 가면 중앙 한계 정리가 더 이상 유지되지 않습니다. 예를 들어 Lorentzian 배포판을 사용하십시오.


+1 또는 랜덤 보행 분포와 같이 무한 분산을 갖는 분포를 취합니다.
Alexis

2
@Alexis-당신이 유한 한 시점에서 임의의 걷기를보고 있다고 가정 할 때, 나는 그것이 유한 분산을 갖는 iid 단계 의 합인 유한 분산을 가질 것이라고 생각했을 것입니다n
Henry

1
@ 헨리 : 아니, 특정 시점을 가정하지 않고 무한 길이의 모든 가능한 임의의 도보 분포의 분산.
Alexis

1
각 단계의 경우 @Alexis 임의의 도보는 + 1 또는 - 1 개 동일한 확률로 IID와 위치는 Y , N = Σ n은 1 X 후, 중심 극한 정리가 같은 것을 정확하게 의미 당신이이 분배 분포에 수렴Xi+11Yn=1nXinn(1nYn)=YnnN(0,1)
헨리

1
@Alexis 각 개별 분포에는 여전히 유한 분산이 있기 때문에 CLT에는 중요하지 않습니다.
큐빅

15

아니오, CLT는 가정이 유지 될 때 항상 보유합니다. "대부분의 상황에서"와 같은 자격 조건은 CLT를 적용해야하는 조건에 대한 비공식적 인 참조입니다.

예를 들어, Cauchy 분포에서 독립 변수의 선형 조합은 정규 분포 변수에 합산되지 않습니다 . 이유 중 하나는 Cauchy 분포에 대해 분산이 정의되지 않은 반면 CLT는 분산에 대해 특정 조건을 설정하는 것입니다 (예 : 유한해야 함). 흥미로운 사실은 Monte Carlo 시뮬레이션이 CLT에 의해 동기 부여되므로 Cauchy와 같은 뚱뚱한 꼬리 분포를 다룰 때 Monte Carlo 시뮬레이션에주의해야한다는 것입니다.

CLT 의 일반화 된 버전 이 있습니다. Cauchy 분포와 같은 무한 또는 정의되지 않은 분산에 적용됩니다. 잘 동작하는 많은 분포와 달리, 정상적으로 정규화 된 코시 수의 합은 코시로 남아 있습니다. 가우시안으로 수렴하지 않습니다.

그건 그렇고, 가우시안뿐만 아니라 다른 많은 배포판에는 종 모양의 PDF가 있습니다 (예 : Student t). 그렇기 때문에 당신이 인용 한 설명이 의도적으로 자유롭고 부정확 한 이유입니다.


7

여기에 천사의 대답의 그림이며, 1E5의 히스토그램에 의해 (조정에서 그립니다 ) 개의 자유도와 t-분포 샘플 수단이되도록분산은 존재하지 않는다.n

nn=10001/2π0.4

여기에 이미지 설명을 입력하십시오

library(MASS)
n <- 1000
samples.from.t <- replicate(1e5, sqrt(n)*mean(rt(n, df = 2)))
truehist(samples.from.t, xlim = c(-10,10), col="salmon")

3
t30.416π0.231

좋은 점은 즉, 하나에 의해 평균 표준화 수도 sd(x)뭔가 얻을 경우 CLT 작동하는 N에 슬러 츠키의 정리에 의해 수렴, (0,1) 변량을. 예제를 단순하게 유지하고 싶었지만 물론 그렇습니다.
Christoph Hanck

6

CLT가 매우 실용적인 이유로 보유 할 수없는 간단한 경우는 무작위 변수의 시퀀스가 한 쪽에서 엄격하게 확률 한계에 도달 할 때 입니다. 예를 들어 경계에있는 것을 추정하는 추정기에서이 문제가 발생합니다.

θU(0,θ)θθθ

적절하게 조정 된 추정량에는 제한 분포가 있지만 "CLT 종류"는 아닙니다.


3

여기 에서 빠른 해결책을 찾을 수 있습니다 .

중심 제한 정리에 대한 예외가 발생한다

  1. 높이가 같은 최대 값이 여러 개인 경우
  2. 이차 미분이 최대로 사라지는 곳.

@cherub의 답변에 요약 된 다른 예외가 있습니다.


math.stackexchange 에서 동일한 질문이 이미 요청되었습니다 . 거기에서 답변을 확인할 수 있습니다.


5
"최대"란 모드를 의미합니까? 바이 모달이라는 것은 CLT를 충족시키지 못하는 것과는 아무런 관련이 없습니다.
누적

M(z)=n=P(X=n)zn

@AlexR. 대답은 링크를 읽지 않으면 전혀 의미가 없으며 링크를 통해서도 명확하지 않습니다. 나는 링크 전용 답변보다 더 나쁘다고 생각합니다.
Accumulation
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.