답변:
이를 이해하려면 먼저 중앙 한계 정리의 버전을 명시해야합니다. 다음은 중심 한계 정리의 "일반적인"진술입니다.
Lindeberg–Lévy CLT. 가 및 인 iid 임의 변수의 시퀀스 라고 가정하십시오 . 보자 . 그 다음으로 무한대에 가까워, 랜덤 변수 정규 분포에 수렴 , 즉
그렇다면 이것이 비공식적 인 설명과 어떻게 다릅니 까? 그리고 그 차이는 무엇입니까? 비공식적 설명과이 설명 사이에는 몇 가지 차이점이 있으며, 그 중 일부는 다른 답변에서 논의되었지만 완전히 설명되지는 않았습니다. 따라서 우리는 이것을 세 가지 구체적인 질문으로 바꿀 수 있습니다.
한 번에 하나씩 복용하면
동일하게 분포되지 않음 , 가장 일반적인 결과는 Lindeberg 및 Lyaponov 버전의 중앙 한계 정리입니다. 기본적으로 표준 편차가 지나치게 커지지 않는 한 적절한 중심 한계 정리를 얻을 수 있습니다.
랴푸 노프 CLT. [5] 가 각각 유한 한 예상 값 및 분산 를 갖는 독립적 인 랜덤 변수의 시퀀스 라고 가정 하십시오.μ i σ 2 s 2 n = ∑ n i = 1 σ 2 i
일부 경우 Lyapunov의 조건 에 만족하면 은 n이 무한대로 가면서 표준 정규 확률 변수로 분포가 수렴합니다.Lim n → ∞ 1Xi-μi/sn
무한 분산 중앙 한계 정리와 유사한 정리는 무한 분산을 갖는 변수에 대해 존재하지만 조건은 일반적인 중앙 한계 정리보다 훨씬 더 좁습니다. 기본적으로 확률 분포의 꼬리는 대해 대해 점근선이어야합니다 . 이 경우, 적절한 스케일 된 서먼 드는 Levy-Alpha 안정적인 분포로 수렴됩니다 .
독립성의 중요성 비 독립적 시퀀스에 대한 많은 다른 중심 한계 정리가 있습니다. 그것들은 모두 매우 맥락 적입니다. 배트맨이 지적했듯이 Martingales에게는 하나가 있습니다. 이 질문은 진행중인 연구 분야이며, 관심있는 특정 상황에 따라 다양한 변형이 있습니다. 이 질문 수학 거래소에이 질문에 관련된 다른 게시물입니다.
이전에 답변을 받았다고 확신하지만 여기에 다른 질문이 있습니다.
중심 한계 정리의 여러 버전이 있으며, 가장 일반적인 것은 임의의 확률 밀도 함수가 주어지면 변수의 합은 평균 값의 합과 같은 평균 값과 분산이 합입니다. 개별 차이의.
매우 중요하고 관련된 제약은 주어진 PDF의 평균과 분산이 존재해야하며 유한해야한다는 것입니다.
따라서 평균 값이나 분산없이 PDF를 가져 가면 중앙 한계 정리가 더 이상 유지되지 않습니다. 예를 들어 Lorentzian 배포판을 사용하십시오.
아니오, CLT는 가정이 유지 될 때 항상 보유합니다. "대부분의 상황에서"와 같은 자격 조건은 CLT를 적용해야하는 조건에 대한 비공식적 인 참조입니다.
예를 들어, Cauchy 분포에서 독립 변수의 선형 조합은 정규 분포 변수에 합산되지 않습니다 . 이유 중 하나는 Cauchy 분포에 대해 분산이 정의되지 않은 반면 CLT는 분산에 대해 특정 조건을 설정하는 것입니다 (예 : 유한해야 함). 흥미로운 사실은 Monte Carlo 시뮬레이션이 CLT에 의해 동기 부여되므로 Cauchy와 같은 뚱뚱한 꼬리 분포를 다룰 때 Monte Carlo 시뮬레이션에주의해야한다는 것입니다.
CLT 의 일반화 된 버전 이 있습니다. Cauchy 분포와 같은 무한 또는 정의되지 않은 분산에 적용됩니다. 잘 동작하는 많은 분포와 달리, 정상적으로 정규화 된 코시 수의 합은 코시로 남아 있습니다. 가우시안으로 수렴하지 않습니다.
그건 그렇고, 가우시안뿐만 아니라 다른 많은 배포판에는 종 모양의 PDF가 있습니다 (예 : Student t). 그렇기 때문에 당신이 인용 한 설명이 의도적으로 자유롭고 부정확 한 이유입니다.
여기에 천사의 대답의 그림이며, 1E5의 히스토그램에 의해 (조정에서 그립니다 ) 개의 자유도와 t-분포 샘플 수단이되도록분산은 존재하지 않는다.
library(MASS)
n <- 1000
samples.from.t <- replicate(1e5, sqrt(n)*mean(rt(n, df = 2)))
truehist(samples.from.t, xlim = c(-10,10), col="salmon")
sd(x)
뭔가 얻을 경우 CLT 작동하는 N에 슬러 츠키의 정리에 의해 수렴, (0,1) 변량을. 예제를 단순하게 유지하고 싶었지만 물론 그렇습니다.
CLT가 매우 실용적인 이유로 보유 할 수없는 간단한 경우는 무작위 변수의 시퀀스가 한 쪽에서 엄격하게 확률 한계에 도달 할 때 입니다. 예를 들어 경계에있는 것을 추정하는 추정기에서이 문제가 발생합니다.
적절하게 조정 된 추정량에는 제한 분포가 있지만 "CLT 종류"는 아닙니다.
중심 제한 정리에 대한 예외가 발생한다
@cherub의 답변에 요약 된 다른 예외가 있습니다.
math.stackexchange 에서 동일한 질문이 이미 요청되었습니다 . 거기에서 답변을 확인할 수 있습니다.