답변:
작은 샘플과 큰 샘플 사이의 경계에 대해 n = 30을 선택 하는 것은 경험에 한합니다. 예를 들어 Hogg and Tanis의 Probability and Statistical Inference (7e)는 "25 또는 30보다 큼" 과 같이이 값을 인용하는 책이 많이 있습니다.
즉, 이야기는 30이 좋은 경계로 여겨지는 유일한 이유 는 교과서 뒤에있는 예쁜 학생의 t 테이블이 한 페이지에 잘 들어 맞기 때문 이었다는 것 입니다. 즉, 임계 값 (Student 's t 와 Normal 사이 )은 어쨌든 df = 30에서 df = 무한대까지 약 0.25까지만 꺼져 있습니다. 손 계산의 경우 그 차이는 실제로 중요하지 않았습니다.
요즘에는 모든 종류의 물건에 대한 임계 값을 소수점 이하 15 자리까지 쉽게 계산할 수 있습니다. 게다가 우리는 파라 메트릭 모집단 분포로 제한되지 않는 리샘플링 및 순열 방법도 있습니다.
실제로 저는 n = 30 에 의존하지 않습니다 . 데이터를 플로팅합니다. 원하는 경우 정규 분포를 중첩하십시오. 정규 근사치가 적절한 지 육안으로 평가하고 근사치가 실제로 필요한지 묻습니다. 연구를 위해 샘플을 생성하고 근사치가 필수 인 경우, 근사값을 원하는만큼 가깝게 (또는 계산 상 가능한 한 가깝게) 만들기에 충분한 표본 크기를 생성하십시오.
실제로, "매직 넘버"(30)는 오류이다. Jacob 's Cohen의 유쾌한 논문, 내가 배운 것들 (지금까지) (Am. Psych. December 1990 45 # 12, pp 1304-1312) 참조 . 이 신화는 "당신이 배우는 것들이 그렇지 않다"는 그의 첫 번째 예입니다.
보다 일반적으로 CLT에는 다음 두 가지 기둥이 필요합니다.
(이러한 조건은 다소 약화 될 수 있지만 차이점은 대체로 이론적 인 특성입니다)