두 가지 평균을 비교하기 위해 t- 검정 대신 분산 분석을 사용하는 것이 잘못 되었습니까?


11

저는 급여가 분포되어 있으며 남성과 여성의 평균 차이를 비교하고 싶습니다. 나는 두 가지 방법을 비교하기위한 학생 T- 테스트가 있다는 것을 알고 있지만 ANOVA를 제안한 후 ANOVA가 두 가지 이상의 방법을 비교한다는 비판을 받았습니다.

무엇 (어떤 경우)입니다 잘못 만이 수단을 비교하는 그것을 사용에?


9
누가 틀렸다고합니까?
gung-Monica Monica 복원

1
가정을 억제하는 질문을 바꾸지 않는 이유는 무엇입니까? "두 그룹을 비교할 때 ANOVA가 t- 테스트와 동일합니까?" 그냥 아이디어 ... 나는 질문이 어느 쪽이든 환영받을 방법에 대한 책임을지지 않습니다 :-)
Antoni Parellada

4
또는 다른 사람이 잘못되었다고 말하도록 질문을 수정하십시오. 여기서의 어려움은 문제의 전제입니다 (잘못되었습니다).
Glen_b-복지 주 모니카

1
전제가 잘못되어 있지만,이 질문은 주제에 맞지 않는 것 같거나 답이 불가능하다는 것이 확실하지 않습니다 (실제로 답을 얻었습니다). 나는 이것이 열려있을 수 있다고 생각합니다.
gung-복직 모니카

1
@ gung. 나는 그 질문이 그 주제에 대한 지식의 부족을 반영한다고 생각한다. 다르게 표현 된 (혹은 "더 나은") 단어라면, 아마도 그 대답을 이미 알고 있었기 때문에 질문을받지 않았을 것입니다.
D_Williams

답변:


20

그것은 틀린 것이 아니며 동일한 분산을 가정하는 테스트와 동일합니다. 또한, 두 그룹으로 sqrt (f-statistic)은 t- 통계량의 (거의 값)와 같습니다. 분산이 같지 않은 t- 검정이 동등하지 않다고 확신합니다. 분산이 같지 않을 때 적절한 추정값을 얻을 수 있기 때문에 (분산은 일반적으로 소수 자릿수와 항상 같지 않음) 분산 분석보다 더 유연하므로 t- 검정을 사용하는 것이 좋습니다 (두 그룹 만 있다고 가정).

최신 정보:

다음은 등분 산 t- 검정에 대한 t- 통계량 ^ 2 (동일 t- 검정이 아님)이 f- 통계량과 동일하다는 것을 보여주는 코드입니다.

dat_mtcars <- mtcars

# unequal variance model
 t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars)
 t_stat_unequal <-  t_unequal$statistic

# assume equal variance
 t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars)
 t_stat_equal <- t_equal$statistic

# anova
 a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars)
 f_stat <- anova(a_equal)
 f_stat$`F value`[1]

# compare by dividing (1 = equivalence)
 (t_stat_unequal^2) / f_stat$`F value`[1] 
 (t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F

3
+1, 불균형 분산에 대해 일원 분산 분석 / F- 검정을 조정할 수 있습니다 (참조, 이 분산 데이터에 대한 일원 분산 분석의 대안 ).
gung-모니 티 복원

@gung OK. 나는 언젠가 분산 분석을 사용하지 않았기 때문에 (베이지안 일을 했으므로) 이것에 대해 확신하지 못했습니다.
D_Williams


4

그것들은 동등합니다. 그룹이 두 개인 ANOVA는 t- 검정과 같습니다. 차이점은 여러 그룹이있을 때 가설을 함께 테스트 할 수 없으므로 t- 검정에 대한 제 1 종 오류가 증가한다는 것입니다. F- 검정을 통해 공동으로 검정 할 때 ANOVA는이 문제점을 겪지 않습니다.


1
나는 그것이 힘을 잃는다 고 생각하지 않습니다. 나는 그것이 타입 I 오류와 더 관련이 있다고 생각합니다. 일반적으로 테스트 횟수가 많을수록 더 높은 성능을 얻을 수 있습니다.
HelloWorld

나는 (@StudentT가 말했듯이) 유형 I 오류의 문제라고 생각합니다. 물론 내가 이것을 "Bonferroni Correction"으로 정확하게 사용하게하고 있습니다. en.wikipedia.org/wiki/Bonferroni_correction
Pablo Fernandez

네 맞습니다. 전원 (타입 II)이 아니라 타입 I 오류 여야합니다. 나는 추론이 정확하다고 생각하지만 어떤 이유로 든 힘을 썼으며 유형 1 오류는 아닙니다. 다른 사람을 속이지 않도록 편집 할 것입니다.
robinsa
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.