Fisher의 정확한 검정은 어떤 분포를 가정합니까?


11

필자의 작업에서 Fisher의 정확한 테스트를 여러 번 사용한 것을 보았으며 데이터에 얼마나 적합한 지 궁금했습니다. 몇 가지 출처를 살펴보면 통계를 계산하는 방법을 이해했지만 귀무 가설에 대한 명확하고 공식적인 설명은 보지 못했습니다.

누군가가 가정 배포판에 대한 공식적인 설명을 설명하거나 저에게 설명 할 수 있습니까? 우발 사태 표의 값에 대한 설명에 감사드립니다.


3
2x2의 경우에는 초기 하 분포를 기반으로합니다.
Glen_b-복지 모니카

답변:


11

2×2X1Bin(n1,θ1)X2Bin(n2,θ2)θ1=θ2X1X1+X2ψ=θ11θ1θ21θ2ψ=1

이 배포판에는 Wikipedia 페이지가 있습니다.

R로 평가하려면 조건부 확률을 정의하는 공식을 사용하면됩니다.

p1 <- 7/27
p2 <- 14/70
x1 <- 7; n1 <- 27
x2 <- 14; n2 <- 56
# 
m <- x1+x2
dbinom(x1, n1, p1)*dbinom(x2, n2, p2)/sum(dbinom(0:m, n1, p1)*dbinom(m-(0:m), n2, p2))
[1] 0.1818838

또는 패키지 dnoncenhypergeom기능을 사용하십시오 MCMCpack.

psi <- p1/(1-p1)/(p2/(1-p2)) # this is the odds ratio
MCMCpack::dnoncenhypergeom(x=x1, n1, n2, x1+x2, psi)
[1] 0.1818838

@Stephane에게 감사합니다. 왜 초 지오메트리가되는 이유와 매개 변수가 무엇인지 더 설명 할 수 있습니까?
Amit Lavon

2
@AmitLavon 죄송합니다.이 초기 하 분포에 대한 세부 정보를 모릅니다.
Stéphane Laurent

1
@ AmitLavon 방금 Wikipedia와 R 코드에 대한 링크를 포함하도록 답변을 편집했습니다.
Stéphane Laurent

10

χ2

  • 연관성에 대해 평가되는 두 가지 변수는 실제로 사멸 / 존재하는 미국 / 유럽과 같은 다원적 또는 전혀없는 변수입니다. 변수 중 하나 또는 둘 다가 기본 연속체를 단순화하는 경우 범주 형 데이터 분석을 전혀 수행하지 않아야합니다.
  • YXYY=yXxYX2×2연속성 테이블 테스트는 치료 A의 모든 대상이 동일한 사망 확률을 갖는 것으로 가정합니다. [이것은 너무 엄격한 가정이라고 주장 할 수 있지만, 그 입장은 조정되지 않은 연관성 테스트를 수행함으로써 전력 손실을 인식하지 못한다.]

χ2XYYPPχ2 P


@FrankHarrell 감사합니다. 카이-제곱 P- 값이 Fisher의 것보다 더 정확하다는 주장을 언급 할 수 있습니까?
Amit Lavon

1
예를 들어 citeulike.org/user/harrelfe/tag/fishers-exact-test를 참조하십시오 . 이것은 스택 교환에 대해 오랫동안 논의되었습니다.
Frank Harrell

슬프게도 ctiteulike는 사라졌고 web.archive.org는 harrelfe 계정의 첫 페이지 만 크롤링 한 것으로 보입니다.
Glen_b-복지국 Monica

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.