중앙 한계 정리 (Central Limit Theorem)로 인해 * 분포 *되지 않은 정규 분포 변수의 예가 있습니까?


11

정규 분포는 CLT를 배우기 전까지는 직관적이지 않은 것으로 보입니다. 이는 CLT가 실제 생활에서 왜 널리 퍼져 있는지를 설명합니다. 그러나 그것은 어느 정도의“자연적인”분포로 발생 하는가?


4
확산에 대한 물리적 이론은 어떤 시스템에도 적용 할 수있는 한 지점에서 발생하는 온도 또는 농도와 같은 양의 정규 분포를 예측합니다. 실제로, 많은 시스템들이 확산 적이며 (옵션 가격, 균일 한 매체에서의 입자 운반 등), 정규 분포가 비현실적으로 크거나 작은 값을 정확하게 유지해야한다고 가정 할 정도로 순진하지 않다고 가정 할 경우, 예가 풍부하다고 제안합니다 그것은 모든 물리적 이론에 대한 오해 일 것입니다.
whuber

2
정규 분포는 고정 분산의 제약 조건에서 엔트로피를 최대화한다는 것을 알 때까지 직관적이지 않은 것으로 보입니다.
leonbloy

답변:


11

어느 정도까지는 이것이 통계적인 문제만큼 철학적 인 문제 일 수 있다고 생각합니다.

많은 자연 현상이 거의 정규 분포합니다. 그 근본 원인 이 CLT와 같은지 여부를 논쟁 할 수 있습니다.

  • 사람들의 키 는 많은 작은 원인 (아마도 독립적, 동일하게 분포되지 않을 수도 있음)의 합으로 간주 될 수 있습니다 : 다양한 뼈의 길이, 다양한 유전자 발현의 결과, 또는 많은식이 영향의 결과 또는 위의 모든 조합 .

  • 시험 점수 는 많은 개별 시험 문제에 대한 점수의 합으로 간주 될 수 있습니다 (아마도 완전히 독립적 일 수는 없지만 동일하게 분포 된 것 같습니다).

  • 유체에서 의 브라운 운동 의 결과로 입자가 1 차원으로 이동하는 거리 : 운동은 분자에 의한 IID 무작위 타격으로 인한 무작위 보행으로 추상적으로 간주 될 수 있습니다.

CLT가 반드시 필요하지 않은 한 가지 예 는 황소 눈 주위의 샷 분산입니다. 황소 눈 으로부터의 거리는 레일리 분포 (2 DF를 갖는 카이-제곱의 제곱근에 비례)와 시계 반대 방향 각도로 모델링 할 수 있습니다 양의 수평 축은 균일 한 것으로 모델링 될 수 있습니다그런 다음 극좌표에서 직사각형 좌표로 변경 한 후 수평 (x) 및 수직 (y) 방향의 거리는 상관이없는 이변 량 법선으로 나타납니다. [이것은 Google 에서 수행 할 수 있는 Box-Muller 변환 의 핵심입니다 .] 그러나 일반적인 x 및 y 좌표는 타겟팅시 많은 작은 부정확도의 합으로 간주되어 백그라운드에서 CLT 관련 메커니즘을 정당화 할 수 있습니다. .(0,2π).

역사적 의미에서, 천문 관측모델링 하기 위해 이중 지수 (Laplace) 분포 대신 정규 (Gaussian) 분포의 광범위한 사용은 부분적으로 CLT에 기인 할 수 있습니다. 이러한 관측치의 모델링 오류 초기에는 가우스와 라플라스 사이논쟁 이 있었으며 , 각자 자신이 선호하는 분포를 주장했습니다. 여러 가지 이유로 일반 모델이 나왔습니다. 정규 분포의 최종 성공에 대한 한 가지 이유는 CLT의 정규 한계를 기반으로 한 수학적 편의라고 주장 할 수 있습니다. 어떤 분포 군이 더 잘 맞는지 확실하지 않은 경우에도 마찬가지입니다. (지금까지도 "최고의 관찰"이라고 생각하는 천문학 자들이 있습니다세심하고 존경받는 천문학 자에 의해 만들어지는 것은 아마도 재능이 덜한 관찰자들에 의해 만들어진 많은 관측치 의 평균 보다 더 나은 가치로 묶여있다 . 실제로 통계 학자들은 개입을 전혀 선호하지 않을 것입니다.)


네. 여전히 오타 수정. 이것을 알아 주셔서 감사합니다. '시험 점수'에서도 동일한 오류가 수정되었습니다.
BruceET

-3

자연적으로 발생하는 많은 변수가 정상적으로 분포됩니다. 인간의 높이? 동물 식민지의 크기?


1
@Happy 정규 분포의 지원은-무한대 + 무한대이고 주어진 예는 절대로 0 이하일 수 있으므로 실제로 여기에 주어진 예는 정규적으로 분포되지 않습니다. 각 경우에 정규 분포가 유용한 근사치 일 수 있지만 분포의 꼬리에 관심이있는 경우에는 그렇지 않습니다.
JeremyC

2
인간의 키는 (대략) 독립적 인 유전자의 합의 결과이므로 실제로 CLT 때문입니다.
gardenhead

2
@ArtemMavrin : 음수 높이를 얻는 것은 8+ 표준 편차와 같습니다. 확률 근사 질량이 8 sd를 넘어서서 정규 근사에 대한 하나의 객체가 유효하지 않은 경우, 실제로 정규 분포 값이 확률 1과 비이성적이지만 모든 측정치가 합리적인 수치 라고 불평 할 수도 있습니다 .
Cliff AB

1
@ArtemMavrin : 글쎄, 질문이 정확히 정상적으로 배포 된 것이라면 그 대답은 간단합니다. 조차도 rnorm(1). 다항식 이외의 모든 분포와 동일합니다.
Cliff AB

2
n
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.