정규 분포는 CLT를 배우기 전까지는 직관적이지 않은 것으로 보입니다. 이는 CLT가 실제 생활에서 왜 널리 퍼져 있는지를 설명합니다. 그러나 그것은 어느 정도의“자연적인”분포로 발생 하는가?
정규 분포는 CLT를 배우기 전까지는 직관적이지 않은 것으로 보입니다. 이는 CLT가 실제 생활에서 왜 널리 퍼져 있는지를 설명합니다. 그러나 그것은 어느 정도의“자연적인”분포로 발생 하는가?
답변:
어느 정도까지는 이것이 통계적인 문제만큼 철학적 인 문제 일 수 있다고 생각합니다.
많은 자연 현상이 거의 정규 분포합니다. 그 근본 원인 이 CLT와 같은지 여부를 논쟁 할 수 있습니다.
사람들의 키 는 많은 작은 원인 (아마도 독립적, 동일하게 분포되지 않을 수도 있음)의 합으로 간주 될 수 있습니다 : 다양한 뼈의 길이, 다양한 유전자 발현의 결과, 또는 많은식이 영향의 결과 또는 위의 모든 조합 .
시험 점수 는 많은 개별 시험 문제에 대한 점수의 합으로 간주 될 수 있습니다 (아마도 완전히 독립적 일 수는 없지만 동일하게 분포 된 것 같습니다).
유체에서 의 브라운 운동 의 결과로 입자가 1 차원으로 이동하는 거리 : 운동은 분자에 의한 IID 무작위 타격으로 인한 무작위 보행으로 추상적으로 간주 될 수 있습니다.
CLT가 반드시 필요하지 않은 한 가지 예 는 황소 눈 주위의 샷 분산입니다. 황소 눈 으로부터의 거리는 레일리 분포 (2 DF를 갖는 카이-제곱의 제곱근에 비례)와 시계 반대 방향 각도로 모델링 할 수 있습니다 양의 수평 축은 균일 한 것으로 모델링 될 수 있습니다그런 다음 극좌표에서 직사각형 좌표로 변경 한 후 수평 (x) 및 수직 (y) 방향의 거리는 상관이없는 이변 량 법선으로 나타납니다. [이것은 Google 에서 수행 할 수 있는 Box-Muller 변환 의 핵심입니다 .] 그러나 일반적인 x 및 y 좌표는 타겟팅시 많은 작은 부정확도의 합으로 간주되어 백그라운드에서 CLT 관련 메커니즘을 정당화 할 수 있습니다. .
역사적 의미에서, 천문 관측 을 모델링 하기 위해 이중 지수 (Laplace) 분포 대신 정규 (Gaussian) 분포의 광범위한 사용은 부분적으로 CLT에 기인 할 수 있습니다. 이러한 관측치의 모델링 오류 초기에는 가우스와 라플라스 사이 에 논쟁 이 있었으며 , 각자 자신이 선호하는 분포를 주장했습니다. 여러 가지 이유로 일반 모델이 나왔습니다. 정규 분포의 최종 성공에 대한 한 가지 이유는 CLT의 정규 한계를 기반으로 한 수학적 편의라고 주장 할 수 있습니다. 어떤 분포 군이 더 잘 맞는지 확실하지 않은 경우에도 마찬가지입니다. (지금까지도 "최고의 관찰"이라고 생각하는 천문학 자들이 있습니다세심하고 존경받는 천문학 자에 의해 만들어지는 것은 아마도 재능이 덜한 관찰자들에 의해 만들어진 많은 관측치 의 평균 보다 더 나은 가치로 묶여있다 . 실제로 통계 학자들은 개입을 전혀 선호하지 않을 것입니다.)
자연적으로 발생하는 많은 변수가 정상적으로 분포됩니다. 인간의 높이? 동물 식민지의 크기?
rnorm(1)
. 다항식 이외의 모든 분포와 동일합니다.