T- 통계량에 정규 분포를 따르기 위해 데이터가 필요한 이유


11

나는 이 노트를 보고 있었고 , 나는이 진술에 당황했다.

정규성에 대해 이야기 할 때 데이터가 정규 분포와 같아야한다는 의미입니다. 여러 통계 검정 (예 : t- 통계)에 의존하기 때문에 이것은 중요합니다.

T- 통계량이 정규 분포를 따르기 위해 데이터가 필요한 이유를 이해하지 못합니다.

실제로 Wikipedia는 같은 것을 말합니다.

학생의 t- 분포 (또는 간단히 t- 분포)는 정규 분포를 가진 모집단의 평균을 추정 할 때 발생하는 연속 확률 분포 제품군의 구성원입니다.

그러나이 가정이 왜 필요한지 이해하지 못합니다.

공식에서 아무것도 데이터가 정규 분포를 따라야한다는 것을 나타냅니다.

여기에 이미지 설명을 입력하십시오

나는 그 정의를 조금 보았지만 왜 조건이 필요한지 이해하지 못한다.

답변:


17

필요한 정보는 Wiki 페이지 의 "Characterization"섹션에 있습니다. 자유 - 분포 정도와 ν는 랜덤 변수의 분포로 정의 될 수있다 T 되도록 T = ZtνT 여기서, Z는 표준 정규 분포 확률 변수이고, V는 A는 χ (2) 자유 정도 랜덤 변수 ν . 또한 Z V 는 독립적이어야합니다. 따라서 위의 정의를 따르는 Z V 가주어지면 t 분포를 갖는 임의의 변수에 도달 할 수 있습니다.

T=ZV/ν,
ZVχ2νZVZVt

이제 이 분포 F 에 따라 분포되어 있다고 가정 합니다. 하자 F는 평균이 μ 이고 분산이 σ 2 . 하자 ˉ는 X 샘플 평균하고 S 2는 표본 분산합니다. 그런 다음 공식을 살펴 보겠습니다.X1,X2,,XnFFμσ2X¯S2

X¯μS/n=X¯μσ/n(n1)S2(n1)σ2.

FX¯N(μ,σ2/n)X¯μσ/nN(0,1)(n1)S2σ2χn12X¯S2tn1

Fχ2t


3
나는 수학 통계에서 이러한 기초적인 결과에 얼마나 많은 수학적 기술이 들어가는 지 항상 흥미로웠다.
Matthew Drury

3
X¯Sχ2

2

통계와 공식, 분포와 공식 사이에 약간의 혼동이있을 수 있습니다. t- 통계량 공식을 모든 데이터 세트에 적용하고 "t- 통계량"을 얻을 수 있지만,이 통계량은 데이터가 정규 분포에서 나온 경우가 아니면 학생 -t 분포에 따라 분포되지 않습니다. t- 통계 공식이 적용될 때 비정규 분포는 학생 t 분포를 생성하지 않지만 확실하지는 않습니다.) 그 이유는 t- 통계량의 분포가이를 생성 한 데이터의 분포로부터 계산되기 때문에 기본 분포가 다른 경우 파생 된 통계에 대해 동일한 분포를 보장 할 수 없습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.