은 VS -test


12

방금 존경받는 (인기있는) 과학 잡지 (독일 PM, 02/2013, p.36)에서 흥미로운 실험에 대해 읽었습니다 (불행히도 소스가 없음). 직관적으로 결과의 중요성을 의심했기 때문에 주목을 받았지만 제공된 정보는 통계 테스트를 재현하기에 충분했습니다.

연구원들은 추운 날씨에 추워지면 감기에 걸릴 확률이 높아지는 지 궁금했습니다. 그래서 그들은 무작위로 180 명의 학생 그룹을 두 그룹으로 나눕니다. 한 그룹은 발을 찬물에 20 분 동안 붙들어 야했습니다. 다른 사람은 신발을 신었습니다. 나는 재미있는 조작의 종류라고 생각하지만, 다른 한편으로는 나는 의사가 아니고 아마도 의사들은 재미 있다고 생각합니다. 윤리적 인 문제는 제쳐두고 있습니다.

어쨌든, 5 일 후, 치료 그룹의 학생 13 명은 감기에 걸렸지 만 그룹에서 5 명만이 신발을 신었습니다. 따라서이 실험의 승산 비는 2.87입니다.

다소 작은 표본 크기를 감안할 때이 차이가 중요한지 궁금해지기 시작했습니다. 그래서 두 가지 테스트를 수행했습니다.

먼저 정규 근사를 사용하여 비율이 동일한 지 간단한 테스트합니다. 이 테스트는 이고 p = 0.0468 입니다. 제 생각 엔 이것이 연구원들이 테스트 한 것입니다. 이것은 실제로 중요합니다. 그러나이 z 테스트는 정상적인 근사로 인해 실수하지 않은 경우 큰 샘플에서만 유효합니다. 또한 유병률은 다소 작으며 이것이 효과의 신뢰 구간의 적용률에 영향을 미치지 않을지 궁금합니다.z=1.988p=0.0468

그래서 두 번째 시도는 Monte-Carlo 시뮬레이션과 표준 Pearson Chi-square를 사용한 카이 제곱 독립 테스트였습니다. 여기에 에 대한 p- 값이 있습니다 .p=.082

이제는 결과에 대해 모두 안심할 수는 없습니다. 이 데이터를 테스트하는 옵션이 더 있고 두 테스트에 대한 귀하의 생각이 무엇인지 궁금했습니다 (특히 첫 번째, 중요한 테스트의 가정).


피어슨의 카이 제곱 통계량에 대해 연속성 보정을 수행했으며 p- 값의 불일치를 설명합니다.
Scortchi-복원 Monica Monica

답변:


13

정규 근사 또는 카이 제곱 대신 순열 테스트 를 사용합니다 . 순열 테스트는 데이터에 따라 정확하고 가장 강력합니다.

이 경우 그룹의 모든 순열을 계산할 수는 없지만 데이터의 임의 순열을 많이 생성하고 매우 정확한 값을 얻을 수 있습니다.

group <- c(rep("A",90),rep("B",90))
n_a <- rep(0,100000)
for (i in 1:length(n_a)) {
   temp <- sample(group, size=18)
   n_a[i] <- sum(temp == "A")
}
> mean(n_a >= 13)
[1] 0.03904

이는 p- 값이 0.039임을 나타냅니다.

그러나, 그러나 이것은 크지 만 감기에 걸리는 대상이 독립적 인 사건이라는 가정이 위반된다고 생각합니다. 이 사람들은 아마도 같은 학교에있는 학생 일 것입니다. 그들 중 두 명이 수업, 기숙사, 또는 다른 활동, 식당 (다양한 식당이있는 학교에서)을 공유한다고 상상해보십시오. "# 1 감기"이벤트와 "# 2 감기"이벤트는 독립적이지 않습니다. 한 학생이 "이 실험에 등록하자!"라고 말할 수 있습니다. 룸메이트 나 친구에게; 교수들이 가르친 수업에서 학생들이 모집되었다고 상상할 수있었습니다. 독립의 가정이 위반되는 많은 방법을 상상할 수있었습니다. 아마 내가 읽지 않은 논문은 이것들 중 일부를 다루고 있지만, 그것들이 어떻게 그것들을 다룰 수 있는지는보기 힘들지만,


@jbowman에게 감사드립니다-또한 일방적 인 테스트를 수행했습니다. 나는 이것이 내가 사용한 양면 테스트보다 더 의미가 있다고 생각합니다. 정규 근사를 한면으로 수행하면 p 값은 .023입니다. 나는 독립에 대한 똥을 좋아합니다. 아마도 학생들은 발을 물에 담을 때 고립되지 않았기 때문에 감기에 걸리는 방법이기도합니다.
tomka

(+1) 그러나 시뮬레이션 할 필요는 없습니다. 테스트 통계의 분포는 귀무 가설 (과 한계 총계의 조건) 하의 초기 하 분포를 따릅니다. 이것은 Fisher의 정확한 테스트입니다.
Scortchi-복원 Monica Monica

11

zχ2

z

zzt

tzz

N91×91=1,729N=180z

χ2

χ2χ2zχ2χ2zz

zχ2


@gung 감사합니다, 당신의 노력에 정말 감사합니다. 더 명확 해집니다.
tomka

@ gung 혼란 스럽습니다-카이 제곱과 z 비율은 동일합니까? stats.stackexchange.com/questions/173415/…
Xavier Bourret Sicotte

@XavierBourretSicotte, z 테스트는 종종 카이 제곱 테스트로 구현되며 R은 예를 들어 수행합니다. 정보가 하나의 변수가 공변량이고 다른 하나는 반응이라는 이해와 일치하는 방식으로 정보가 제공되기 때문에 나는 종종 z- 검정을 사용하는 것을 선호합니다.
gung-모니 티 복원

1
(+1) @XavierBourretSicotte : 두 비율의 차이에 대해 일반적으로 사용되는 두 가지 z- 검정이 있습니다. 하나는 점수 검정이고 Pearson의 카이 제곱 검정 (분모의 분산이 가장 적합하게 계산 됨)과 동일합니다. 없는); 다른 하나는 Wald 검정 (분모의 분산이 두 비율의 차이의 최대 우도 추정치에서 계산 됨)입니다.
Scortchi-Monica Monica 복원

@Scortchi 이것을 명확히 해 주셔서 감사합니다! 차이점에 대한 명시 적 설명을 처음 접했을 때-두 가지 접근 방식이 설명 된 장소에 연결할 수 있습니까? 분산에 대한 해당 공식으로?
Xavier Bourret Sicotte
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.