t- 검정의 정규성 가정에 관한 질문


9

t- 검정의 경우 대부분의 텍스트에 따르면 모집단 데이터가 정규 분포되어 있다고 가정합니다. 왜 그런지 모르겠습니다. t- 검정은 표본 평균의 표본 분포가 모집단이 아닌 정규 분포를 요구할 뿐입니 까?

t- 검정이 궁극적으로 샘플링 분포에서 정규성을 요구하는 경우에 모집단은 어떤 분포처럼 보일 수 있습니까? 합리적인 표본 크기가있는 한. 이것이 중심 제한 정리 상태가 아닙니까?

(여기서는 단일 샘플 또는 독립 샘플 t- 테스트를 참조하고 있습니다)


1
음, 랜덤 변수 인 표본 평균은 단일 부품도 정상일 경우에만 정상일 수 있습니다. 그러나 당신은 옳습니다 : t- 검정은 비대칭 적으로 비모수 적이지만 (정규 분포는 아님) 여전히 그룹 내 차이 (두 표본 상황에서)는 유사하고 존재해야합니다.
Michael M

그룹 내 분산이 비슷 해짐에 따라 분산의 동질성을 가정하고 있습니까? 그렇다면, 웰치의 t- 검정이 이것에 대해 맞습니까?
피터 내쉬

예, 정확히 Welch의 수정 된 자유도가 무한대로된다면, 그의 절차는 분배가 필요하지 않습니다 (그러나 인용이 필요했습니다 ...).
Michael M

답변:


9

t- 검정의 경우 대부분의 텍스트에 따르면 모집단 데이터가 정규 분포되어 있다고 가정합니다. 왜 그런지 모르겠습니다. t- 검정은 표본 평균의 표본 분포가 모집단이 아닌 정규 분포를 요구할 뿐입니 까?

t- 통계량은 랜덤 변수 인 두 가지 양의 비율로 구성됩니다. 그것은 단지 분자로 구성되지 않습니다.

t- 통계량이 t- 분포를 가지기 위해서는 표본 평균이 정규 분포를 갖는 것만이 아닙니다. 또한 다음이 필요합니다.

  • s 분모에서 s2/σ2χd2*

  • 분자와 분모는 독립적입니다.

*(의 가치 d 하나의 샘플에서 어떤 테스트에 따라 달라집니다 t 우리는 d=n1)

이 세 가지 사실이 실제로 적용 되려면 원래 데이터가 정상적으로 배포되어야합니다.

t- 검정이 궁극적으로 샘플링 분포에서 정규성을 요구하는 경우에 모집단은 어떤 분포처럼 보일 수 있습니까?

잠시 주어진 iid를 보자. CLT가 모집단을 보유하려면 조건에 맞아야합니다.-모집단에 CLT가 적용되는 분포가 있어야합니다. CLT가 적용되지 않는 인구 분포가 있기 때문에 아닙니다.

합리적인 표본 크기가있는 한. 이것이 중심 제한 정리 상태가 아닙니까?

CLT는 실제로 "합리적인 표본 크기"에 대해 한 마디도하지 않습니다.

실제로 유한 샘플 크기에서 발생하는 일에 대해서는 전혀 언급하지 않습니다.

지금 특정 배포판을 생각하고 있습니다. 그것은 CLT가 확실히 적용하는 것입니다. 그러나n=1015표본 평균의 분포는 보통 비정규입니다. 그러나 나는 인류 역사상 어떤 표본도 그 안에 많은 가치를 지니고 있다고 의심합니다. 그래서-타톨 로지 밖에서-합리적인 이유는 무엇입니까?n'?


따라서 쌍둥이 문제가 있습니다.

A. 사람들이 일반적으로 CLT에 귀속되는 효과 (소형 / 중간 표본 크기에서 표본 평균 분포의 정규성에 점점 더 근접한 접근 방식)는 실제로 CLT **에 명시되어 있지 않습니다.

B. "분자에서 정상과 멀지 않은 것"으로는 통계가 t- 분포를 갖는 것으로 충분하지 않습니다.

** (Berry-Esseen 정리와 같은 것)은 표본 크기의 분포가 표본 평균의 분포에 미치는 영향을 볼 때 사람들이보고있는 것과 더 비슷합니다.


CLT와 Slutsky의 정리는 (모든 가정이 유지하는 한) 함께 nt- 통계량의 분포는 표준 정규에 접근합니다. 주어진 유한 여부를 말하지 않습니다.n 어떤 목적으로 충분할 수 있습니다.


1
이 세 가지 (샘플 평균의 정규성, 샘플 분산의 카이 제곱 및 두 가지의 독립성)가 실제로 사실이 되려면 원래 데이터가 정상적으로 분포되어 있어야합니다. 노말 만이 그 세 가지 속성을 가지고 있다고 말하고 있습니까? 나는 진술이 틀렸다고 주장하지 않고, 그것이 당신이 말하는 것이 궁금한 것입니다.
Andrew M

2
@AndrewM 확실히 법선 만이 세 가지를 모두 가지고 있습니다. 또한 첫 번째 또는 세 번째만으로는 법선을 암시하기에 충분합니다. 세 번째는 법선을 특징 짓고 ( Lukacs, 1942 ), 유한 수의 독립적 인 랜덤 변수의 경우 법선 만 첫 번째를 갖습니다 ( Cramér 's decomposition theorem ). 두 번째를 얻는 다른 방법이 있다고 생각할 수는 있지만 하나는 알지 못합니다.
Glen_b-복지국 모니카

두 번째와 관련하여 @AndrewM은 Ahsanullah (1987,1989)의 작업이 관련이있을 수 있습니다.
Glen_b-복지국 모니카

1
@Glen_b를 참조 해 주셔서 감사합니다! 나는 Lukacs 결과를 알지 못했으며 Cramer의 분해 정리는 내가 머리 위로 가지고있는 버전보다 오히려 강하다 (X 일반 iff AX 모든 행렬에 대해 보통 A).
Andrew M

@AndrewM 차이점은 당신이 인용 한 결과는 독립에 의존하지 않지만 Cramer의 결과는 그렇습니다. 그들은 모두 자신의 위치에서 유용합니다.
Glen_b-복귀 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.