t- 검정의 경우 대부분의 텍스트에 따르면 모집단 데이터가 정규 분포되어 있다고 가정합니다. 왜 그런지 모르겠습니다. t- 검정은 표본 평균의 표본 분포가 모집단이 아닌 정규 분포를 요구할 뿐입니 까?
t- 통계량은 랜덤 변수 인 두 가지 양의 비율로 구성됩니다. 그것은 단지 분자로 구성되지 않습니다.
t- 통계량이 t- 분포를 가지기 위해서는 표본 평균이 정규 분포를 갖는 것만이 아닙니다. 또한 다음이 필요합니다.
*(의 가치 d 하나의 샘플에서 어떤 테스트에 따라 달라집니다 t 우리는 d=n−1)
이 세 가지 사실이 실제로 적용 되려면 원래 데이터가 정상적으로 배포되어야합니다.
t- 검정이 궁극적으로 샘플링 분포에서 정규성을 요구하는 경우에 모집단은 어떤 분포처럼 보일 수 있습니까?
잠시 주어진 iid를 보자. CLT가 모집단을 보유하려면 조건에 맞아야합니다.-모집단에 CLT가 적용되는 분포가 있어야합니다. CLT가 적용되지 않는 인구 분포가 있기 때문에 아닙니다.
합리적인 표본 크기가있는 한. 이것이 중심 제한 정리 상태가 아닙니까?
CLT는 실제로 "합리적인 표본 크기"에 대해 한 마디도하지 않습니다.
실제로 유한 샘플 크기에서 발생하는 일에 대해서는 전혀 언급하지 않습니다.
지금 특정 배포판을 생각하고 있습니다. 그것은 CLT가 확실히 적용하는 것입니다. 그러나n=1015표본 평균의 분포는 보통 비정규입니다. 그러나 나는 인류 역사상 어떤 표본도 그 안에 많은 가치를 지니고 있다고 의심합니다. 그래서-타톨 로지 밖에서-합리적인 이유는 무엇입니까?n'?
따라서 쌍둥이 문제가 있습니다.
A. 사람들이 일반적으로 CLT에 귀속되는 효과 (소형 / 중간 표본 크기에서 표본 평균 분포의 정규성에 점점 더 근접한 접근 방식)는 실제로 CLT **에 명시되어 있지 않습니다.
B. "분자에서 정상과 멀지 않은 것"으로는 통계가 t- 분포를 갖는 것으로 충분하지 않습니다.
** (Berry-Esseen 정리와 같은 것)은 표본 크기의 분포가 표본 평균의 분포에 미치는 영향을 볼 때 사람들이보고있는 것과 더 비슷합니다.
CLT와 Slutsky의 정리는 (모든 가정이 유지하는 한) 함께 n→∞t- 통계량의 분포는 표준 정규에 접근합니다. 주어진 유한 여부를 말하지 않습니다.n 어떤 목적으로 충분할 수 있습니다.