동일하지 않은 분산으로 t 검정에서 정수가 아닌 자유도에 대한 설명


15

SPSS t- 검정 절차 보고서는 2 개의 독립 평균을 비교할 때 2 개의 분석을 수행합니다. 하나의 분석은 동일한 분산을 가정하고 다른 분석은 동일한 분산을 가정하지 않았습니다. 등분 산을 가정 할 때 자유도 (df)는 항상 정수 값 (및 n-2)입니다. 등분 산이 가정되지 않을 때의 df는 정수가 아니며 (예 : 11.467) n-2 근처에 없습니다. 정수가 아닌 df를 계산하는 데 사용되는 논리 및 방법에 대한 설명을 찾고 있습니다.


3
University of Florida PowerPoint 프레젠테이션에는 불일치 분산의 경우 Student t 통계의 표본 분포에 대한이 근사 가 어떻게 도출 되는지에 대한 좋은 설명이 포함되어 있습니다 .
whuber

웰치의 t- 검정은 항상 더 정확합니까? Welch 접근 방식을 사용하는 데 단점이 있습니까?
Joel W.

Welch와 원래의 t-test가 극적으로 다른 p를 산출한다면, 어느 것을 사용해야합니까? 분산의 차이에 대한 p 값이 .06에 불과하지만 두 t- 검정의 표시 차이가 .000 및 .121이면 어떻게됩니까? (이것은 두 그룹 중 하나의 그룹에 분산이없고 다른 그룹의 그룹에 70,000의 분산이있을 때 발생했습니다.)
Joel W.

2
값을 기준으로 선택하지 마십시오 . 등분 산을 가정 할 충분한 이유가없는 한 (데이터를보기 전에는) 단순히 가정하지 마십시오. p
Glen_b-복귀 모니카

1
질문은 모두 Welch 테스트 사용시기와 관련이 있습니다. 이 질문은 stats.stackexchange.com/questions/116610/
Joel W.

답변:


11

Welch-Satterthwaite df는 해당 표준 편차에 비례하는 가중치를 사용하여 두 자유도의 스케일 된 가중 고조파 평균으로 표시 될 수 있습니다.

원래 표현은 다음과 같습니다.

νW=(s12n1+s22n2)2s14n12ν1+s24n22ν2

참고 의 추정 된 분산이고 I 번째의 샘플의 평균 또는 제곱 제가 번째 평균의 표준 오차 . r = r 1 / r 2 (샘플 평균의 추정 분산 비율)를 보자.ri=si2/niithir=r1/r2

νW=(r1+r2)2r12ν1+r22ν2=(r1+r2)2r12+r22r12+r22r12ν1+r22ν2=(r+1)2r2+1r12+r22r12ν1+r22ν2

첫 번째 인자는 에서 증가되는 1 에서 R = 02 에서 R = 1 다음과 감소가 1 에서 R = ∞를 ; 로그 r 에서 대칭입니다.1+sech(log(r))1r=02r=11r=logr .

두 번째 요소는 가중 고조파 평균입니다 .

H(x_)=i=1nwii=1nwixi.

df의 값, 여기서 는 두 df에 대한 상대 가중치입니다wi=ri2

즉, 가 매우 크면 ν 1로 수렴합니다 . 때는 R 1 / R (2) 에 매우 가깝다 0 그것은 수렴 ν 2 . 때는 R 1 =는 r에 2 에는 DF 배의 조화 평균을 얻고, 경우에 s의 2 (1) = S (2) (2) 또한 최대 가능한 값 통상 동등한 분산 t 테스트 DF 얻을 ν W를 .r1/r2ν1r1/r20ν2r1=r2s12=s22νW

-

등분 산 t- 검정에서 가정이 유지되면 분모의 제곱은 상수 곱하기 카이 제곱 랜덤 변수입니다.

웰치 t- 검정의 분모 제곱은 카이 제곱이 아닙니다. 그러나 종종 근사값은 그리 나쁘지 않습니다. 관련 토론은 여기 에서 찾을 수 있습니다 .

더 많은 교과서 스타일의 파생물은 여기 에서 찾을 수 있습니다 .


1
평균 비율에 대한 산술 평균보다 더 적합한 고조파 평균에 대한 훌륭한 통찰력.
Felipe G. Nievinski

10

당신이 말하는 것은 자유도에 대한 Welch-Satterthwaite 수정 입니다. 는 WS 보정이 적용되면 -test은 종종라고 웰치 t -test . (우연히, 이것은 SPSS와 관련이 없으며 모든 통계 소프트웨어는 Welch 's t 를 수행 할 수 있습니다ttttts12/n1s22/n2t


한 번의 t- 검정의 경우 SPSS는 df를 26.608로보고하지만 두 그룹의 n은 22와 104입니다. "적절한 df는 전체 df와 더 큰 그룹의 df 사이에 있어야합니다"에 대해 확실합니까? (더 작은 그룹과 큰 그룹의 경우 표준 편차는 각각 10.5와 8.1입니다.)
Joel W.

2
의 상대 크기에 따라 다릅니다.s12/n1s22/n2. If the larger n is associated with a sufficiently larger variance, the combined d.f. can be lower than the larger of the two d.f. Note that the Welch t-test is only approximate, since the squared denominator is not actually a (scaled) chi-square random variate. However in practice it does quite well.
Glen_b -Reinstate Monica

I think I'll expand on the relationship between the relative sizes of the (si2/ni) and the Welch d.f. in an answer (since it won't fit in a comment).
Glen_b -Reinstate Monica

1
@Glen_b, I'm sure that will be of great value here.
gung - Reinstate Monica
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.