t- 검정과 분산 분석이 왜 두 그룹 비교에 대해 다른 p- 값을 제공합니까?


18

에 Wikipedia 기사에서 ANOVA , 그것은 말한다

ANOVA는 가장 간단한 형태로 여러 그룹의 평균이 같은지 여부에 대한 통계 테스트를 제공하므로 t- 검정을 두 그룹 이상으로 일반화합니다.

이것에 대한 나의 이해는 분산 분석이 두 그룹 비교와 관련하여 t- 검정과 동일하다는 것입니다.

그러나 아래의 간단한 예제 (R)에서 ANOVA와 t-test는 비슷하지만 약간 다른 p- 값을 제공합니다. 아무도 이유를 설명 할 수 있습니까?

x1=rnorm(100,mean=0,sd=1)
x2=rnorm(100,mean=0.5,sd=1)

y1=rnorm(100,mean=0,sd=10)
y2=rnorm(100,mean=0.5,sd=10)

t.test(x1,x2)$p.value  # 0.0002695961
t.test(y1,y2)$p.value  # 0.8190363

df1=as.data.frame(rbind(cbind(x=x1,type=1), cbind(x2,type=2)))
df2=as.data.frame(rbind(cbind(x=y1,type=1), cbind(y2,type=2)))

anova(lm(x~type,df1))$`Pr(>F)`[1]  # 0.0002695578
anova(lm(x~type,df2))$`Pr(>F)`[1]  # 0.8190279

답변:


28

기본적으로 인수 var.equalt.test()equals FALSE입니다. 에서 lm(), 잔차는 일정한 분산을 가정한다. 따라서, 설정 var.equal = TRUE에서 t.test(), 동일한 결과를 얻을 수 있습니다.

var.equals두 분산을 동일하게 취급할지 여부를 나타냅니다. 참이면 풀링 된 분산을 사용하여 분산을 추정하고 그렇지 않으면 자유도에 대한 Welch (또는 Satterthwaite) 근사값을 사용합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.