인구에서 생물 의학 양의 측정이 정상적인 "종 모양 곡선"을 따르는 것은 의학과 같은 응용 분야의 가르침에 뿌리 내리고 있습니다. 하여 문자열의 Google 검색은 "우리는 정규 분포 가정" 반환결과! 그들은 기후 변화에 관한 연구에서 "소수의 극단 데이터 포인트가 주어지면 온도 이상에 대한 정규 분포를 가정했다"는 것처럼 들린다 . 또는 "우리는 병아리 에 대한 논쟁의 여지가 적은 문서에서 병아리 부화 날짜의 정상적인 분포를 가정했습니다" ; 또는 "우리는 정상적인 GDP 성장 충격 분포를 가정하여" 시장에서 거시 경제적 변화를 언급했다 ( 이 책 을 기억 하고 다른 것들을 가져옴 ).
최근에, 나는 엄밀히 긍정적 인 성격으로 인해 카운트 데이터를 정상적으로 분포 된 것으로 취급하는 것에 의문을 제기했습니다. 물론, 카운트 데이터는 불 연속적이어서 정규성이 더 인공적입니다. 그러나 후자의 요점을 제쳐두고도, 왜 프로토 타입 적으로 "연속적인"것으로 간주되는 포도당의 무게, 높이 또는 농도와 같은 지속적인 경험적 측정이 정상으로 간주되어야 하는가? 그들은 카운트보다 더 이상 부정적인 실현 관찰을 가질 수 없습니다!
표준 편차가 평균보다 실질적으로 낮을 때 음수 값이 거의 없음 ( "95 % 범위 확인")을 나타내는 것은 실제적인 가정 일 수 있으며 너무 치우 치지 않으면 주파수 막대 그래프가이를 지원할 수 있음을 이해합니다. 그러나 그 질문은 사소한 것 같지 않았으며 빠른 검색으로 흥미로운 내용이 나왔습니다.
에서 자연 우리는에 다음 문을 찾을 수 있습니다 DF 히스로 편지 : "나는 특정 유형의 데이터의 통계적 분석을위한 데이터가 일반 인구에서 도출되는 가정은 일반적으로 잘못된 것을 지적하고자하고, 대체 그 이 대안은 통계 학자, 경제학자, 물리학 자들이 널리 사용하지만 어떤 이유로 다른 학문 분야의 과학자들은 종종 무시한다. "
Limpert는 "대수-정규 모형은 현재 많은 과학자들이 정상을 유효한 근사치로 인식한다는 점에서 근사치로 작용할 수있다" 면서도 정규성에 대한 적합도 검정의 낮은 힘과 선택의 어려움을 지적했습니다. 작은 샘플을 다룰 때 경험적으로 올바른 분포.
따라서 문제는 "추가 지원 증거없이 응용 과학에서 경험적 측정의 정규 분포를 가정하는 것이 언제 가능할까요?"입니다. 그리고 왜 로그 노멀과 같은 다른 대안이 채택되지 않았을까요?