귀무 가설이 경우 이항 데이터의 검정력 분석


10

, 하여 이항 데이터의 단일 표본에 대한 검정력 분석을 수행하려고합니다 여기서 는 모집단의 성공 비율입니다. 경우 , I는 이항 법선 근사하거나 또는 사용할 수 -test하지만과 이 모두 실패한다. 이 분석을 수행 할 수있는 방법이 있는지 알고 싶습니다. 제안, 의견 또는 언급이 있으면 대단히 감사하겠습니다. 많은 감사합니다!H0:p=0H1:p=0.001p0<p<1χ2p=0


그렇다면 왜 정확한 Clopper-Pearson 테스트를 사용하지 않습니까?
Stéphane Laurent

2
정말 큰 샘플 이 있기를 바랍니다 . 이것은 테스트하기 어려울 것입니다.
Peter Flom

답변:


13

단측의 정확한 대립 가설 여기서 및 있습니다. p 1 = 0.001 p 0 = 0p1>p0p1=0.001p0=0

  • 첫 번째 단계는 크기 의 표본 에서 적어도 성공 을 얻을 확률 이 귀무 가설 (일반적으로 ) 에서 매우 낮 도록 성공 횟수에 대한 임계 값 를 식별하는 것 입니다. 귀하의 경우, 및 대한 특정 선택에 관계없이 입니다.ccnα=0.05c=1n1α>0
  • 두 번째 단계는 대립 가설 하에서 크기가 표본 에서 최소 성공 확률을 찾는 것 입니다. 이것이 바로 귀하의 힘입니다. 이항 분포 이 완전히 지정되도록 고정 된 이 필요 합니다.cnnB(n,p1)

R의 두 번째 단계 :n=500

> n  <- 500                 # sample size
> p1 <- 0.001               # success probability under alternative hypothesis
> cc <- 1                   # threshold
> sum(dbinom(cc:n, n, p1))  # power: probability for cc or more successes given p1
[1] 0.3936211

표본 크기에 따라 검정력이 어떻게 변하는 지 이해하려면 검정력 함수를 그릴 수 있습니다. 여기에 이미지 설명을 입력하십시오

nn   <- 10:2000                 # sample sizes
pow  <- 1-pbinom(cc-1, nn, p1)  # corresponding power
tStr <- expression(paste("Power for ", X>0, " given ", p[1]==0.001))
plot(nn, pow, type="l", xaxs="i", xlab="sample size", ylab="power",
     lwd=2, col="blue", main=tStr, cex.lab=1.4, cex.main=1.4)

미리 지정된 검정력을 달성하기 위해 필요한 표본 크기를 알고 싶다면 위에서 계산 한 검정력 값을 사용할 수 있습니다. 최소 의 거듭 제곱을 원한다고 가정하십시오 .0.5

> powMin <- 0.5
> idx    <- which.min(abs(pow-powMin))  # index for value closest to 0.5
> nn[idx]     # sample size for that index
[1] 693

> pow[idx]    # power for that sample size
[1] 0.5000998

따라서 검정력이 이 되려면 이상의 표본 크기가 필요합니다 .6930.5


에 따르면 pwr.p.test, 0.5의 거듭 제곱에 대해서는 최소한 677 개의 관측치가 필요합니다. 그러나 전력 = 0.5는 매우 낮습니다!
Jessica

@caracal 검정 곡선을 얻기 위해 정규 근사법을 사용하고 있습니까? 정확한 이항 전력 함수는 그렇게 부드럽 지 않습니다. 실제로 샘플 크기 축이 확대되어 있는지 확인할 수있는 톱니 모양입니다. 저는 2002 년 크리스틴 리우와 공동 저술 한 미국 통계학 자의 논문에서 이것을 논의합니다. 또한 이항 법은 p가 매우 낮게 기울어 져있어 정규 근사가 제대로 작동하려면 n이 커야합니다.
Michael R. Chernick

2
@MichaelChernick 아니오, 이것은 정규 근사값이 아닌 이항 분포에서 비롯된 것입니다. 물론, 일반적으로 이항 검정의 검정력은 단조롭지 않은 톱니 기능입니다. 그러나 특별한 경우가 있습니다 . 이는 대립 가설의 수용 영역이 항상 관계없이 1에서 시작 함을 의미합니다 . 상수 임계 값 , 상수 경우 전력은 의 엄격하게 증가하는 함수입니다 . p0=0nc=1p1=0.001n
caracal

@Jessica pwr.p.test()정확한 이항 분포가 아니라 정규 근사값 을 사용합니다. pwr.p.test소스 코드를 보려면 입력 하십시오. pnorm()근사값이 사용되었음을 나타내는 호출을 찾을 수 있습니다.
caracal

1
@caracal이 방법으로 볼 수 있습니다 : 귀무 가설 아래에서 성공 확률은 0이므로 성공을 본다면 귀무 가설을 기각 할 수 있습니다. 따라서 이항 합계가 1에 도달하면 유형 2 오류 0으로 거부 할 수 있기 때문에 임계 값이 1이라고합니다. 대안으로 n 번째 시도에서 첫 번째 성공 확률은 (1-p) p입니다. 이 확률은 n이 무한대로 갈수록 0이됩니다. 따라서 S = 1 일 때 p> 0에 대해 1의 거듭 제곱을 갖는 순차 규칙이 중지됩니다 . n1n
Michael R. Chernick

3

pwrR 의 패키지 로이 질문에 쉽게 대답 할 수 있습니다 .

유의 수준, 검정력 및 효과 크기를 정의해야합니다. 일반적으로 유의 수준은 0.05로 설정되고 검정력은 0.8로 설정됩니다. 전력이 높을수록 더 많은 관측이 필요합니다. 유의 수준이 낮을수록 검정력이 감소합니다.

이 패키지에 사용 된 비율의 효과 크기는 Cohen 's h입니다. 작은 h에 대한 컷오프는 종종 0.20으로 간주됩니다. 실제 컷오프는 응용 프로그램에 따라 다르며 경우에 따라 더 작을 수 있습니다. h가 작을수록 더 많은 관찰이 필요함을 의미합니다. 당신은 당신의 대안이 이라고 말했습니다 . 아주 작습니다p=0.001

> ES.h(.001, 0)
[1] 0.0632561

그러나 우리는 여전히 진행할 수 있습니다.

 > pwr.p.test(sig.level=0.05, power=.8, h = ES.h(.001, 0), alt="greater", n = NULL)

 proportion power calculation for binomial distribution (arcsine transformation) 

          h = 0.0632561
          n = 1545.124
  sig.level = 0.05
      power = 0.8
alternative = greater

이 값을 사용하려면 최소한 1546 개의 관측치가 필요합니다.


1

특정 경우에는 간단한 정확한 해결책이 있습니다.

특정 귀무 가설 에서 성공을 관찰해서는 안됩니다. 따라서 하나의 성공을 관찰하자마자 임을 확신 할 수 있습니다 .H0:p=0p0

대안 하에서 최소 1 개의 성공을 관찰하기 위해 필요한 시행 횟수는 기하 분포를 따릅니다. 따라서 의 거듭 제곱을 달성하기 위해 최소 표본 크기를 얻으려면 와 같이 가장 작은 k를 찾아야합니다.H1:p=0.0011β

1β1(1p)(k1)

따라서 로 검정력 을 얻으려면 최소한 1610 개의 샘플이 필요합니다.p=0.00180


솔루션 1에 대한 의견을 읽으면 이것이 본질적으로 답을 고수 할 때 얻는 것과 동일한 솔루션이라는 것을 알고 있습니다. 그럼에도 불구하고 직관을 통해 도달 할 필요없이 기본적인 확률 이론 결과를 설명하는 것은 결코 해를 끼치 지 않습니다.
띄우기
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.