바이오 마커 연구를위한 검정력 계산 / 샘플 크기


13

환자에게 암이 있는지 여부를 예측할 수있는 잠재적 인 바이오 마커가 있습니다. 바이오 마커 시험 결과는 이진이 양성 또는 음성이다. 우리는이 바이오 마커가 좋은 예측 인자인지 아닌지를 결정하기 위해 검사를 받아야하는 환자의 양을 어느 정도 이해하려고합니다.

인터넷에서 읽을 때가는 방법은 감도 (사례 수)와 특이성 (컨트롤 수)을 보는 것 같습니다. 이 상황을 1- 표본 비율 테스트로 취급하는 것이 좋지만 감도의 정의와 범위를 제외하고는 어떻게 추정해야하는지 확실하지 않습니다. 0.8보다 큰 민감도를 가진 바이오 마커를 "좋은"것으로 생각한다면, 두 변수를 어떻게 설정하겠습니까? 나는 귀무 가설이 바이오 마커가 되길 원합니다. 무작위 할당, 즉 0.5의 감도보다 낫지 않습니다. 누구나 이것을 할 수있는 가장 좋은 방법의 예를 들어 줄 수 있습니까 (특히 R에있는 경우).


일련의 알려진 사례로 시작하고 다음으로 바이오 마커 테스트 (수집 데이터)를 수행하고 민감도를 추정 할 것입니까? 그리고 일련의 알려진 컨트롤로 시작하여 데이터를 수집하고 특이성을 추정 할 수 있습니까?

이 계산에서 유효합니다. 실제로 환자 모집 전에는 알 수 없지만 충분한 사례와 통제가있을 때까지 계속 모집합니다. 또한 환자가 환자가 될 것으로 예상되는 비율이 있으므로이를 사용하여 모집해야 할 총 수를 추정 할 수 있습니다.
danielsbrewer

바이오 마커가 예 / 아니오로만 대답하면 민감도 / 특이성을 가지고 비율 테스트를위한 맥락에서 계획을 세울 수 있습니다. 그들 중 하나의 가치가 "좋은"또는 "나쁜"경우 거짓 결정의 실제 결과에 달려 있습니다. 바이오 마커가 원래 연속 측정을 제공하는 경우 ROC- 곡선 및 AUC 통계 및 해당 샘플 크기 계획 방법이 더 적합 할 수 있습니다. 그러나이 모든 것은 진단 테스트와 관련된 방법의 표면 만 긁습니다 ...
psj

답변:


11

민감도 ( 표시)에 대해 이야기 해 봅시다 . 특성은 비슷합니다. 다음은 빈번한 접근 방식입니다. 여기서 베이지안 중 한 명이 다른 대안을 제시 할 수있는 다른 대답을 추가 할 수 있다면 좋을 것입니다.p

암 환자 명을 모집했다고 가정합니다 . 바이오 마커 테스트를 각각에 적용하므로 0과 1의 시퀀스를 얻게됩니다 . 의 항목은 성공 확률이 Bernoulli 분포를 갖습니다 . 의 추정치 는 입니다. 희망 "큰"입니다, 그리고 당신에 대한 신뢰 구간을 통해 추정의 정확도를 판단 할 수있는 . , P를 P에서 P = Σ X / N의 P는 Pnxxppp^=x/np^p

귀하의 질문에 당신은 얼마나 큰 되어야 하는지 알고 싶다고 말합니다 . 답을 얻으려면 바이오 마커 문헌을 참조하여 "큰"크기와 샘플링 오류로 인해 허용 할 수있는 민감도를 결정해야합니다. 민감도가 보다 크면 (실제로는 좋지 않음) 바이오 마커가 "양호"하다고 결정하고 이 충분히 커야하므로 의 민감도를 90 % 확률로 감지 할 수 있습니다. . 에서 유의 수준을 제어한다고 가정합니다 . p = 0.5 n p = 0.57 α = 0.05np=0.5np=0.57α=0.05

분석과 시뮬레이션의 두 가지 접근 방식이 있습니다. pwr의 패키지 R이미이 설계에 대한 도움에 존재 - 먼저 설치해야합니다. 다음으로 효과 크기가 필요하며 원하는 기능은 pwr.p.test입니다.

library(pwr)
h1 <- ES.h(0.57, 0.5)
pwr.p.test(h = h1, n = NULL, sig.level = 0.05, power = 0.9, alt = "greater")

     proportion power calculation for binomial distribution (arc... 

              h = 0.1404614
              n = 434.0651
      sig.level = 0.05
          power = 0.9
    alternative = greater

따라서 유의 수준이 때 검정력 으로 의 감도를 감지 하려면 약 명의 암 환자 가 필요합니다 . 시뮬레이션 접근법도 시도했지만 비슷한 대답을 제공합니다. 물론, 실제 감도가 보다 높으면 (바이오 마커가 더 좋습니다), 탐지 할 사람이 더 적어야합니다.0.57 0.90 0.05 0.574350.570.900.050.57

데이터를 얻은 후에는 테스트를 실행하는 방법이 있습니다 (논쟁을 위해 데이터를 시뮬레이션하겠습니다).

n <- 435
sens <- 0.57
x <- rbinom(n, size = 1, prob = sens)
binom.test(sum(x), n, p = 0.5, alt = "greater")

    Exact binomial test

data:  sum(x) and n 
number of successes = 247, number of trials = 435,
p-value = 0.002681
alternative hypothesis: true probability of success is greater than 0.5 
95 percent confidence interval:
 0.527342 1.000000 
sample estimates:
probability of success 
             0.5678161 

감도 추정치는 입니다. 실제로 중요한 것은 대한 신뢰 구간 이며,이 경우 입니다.p [ 0.527 , 1 ]0.568p[0.527,1]

편집 : 시뮬레이션 접근 방식이 더 좋으면 다음과 같이 할 수 있습니다.

n <- 435
sens <- 0.57
nSim <- 1000

및 LET runTest

runTest <- function(){
  x <- rbinom(1, size = n, prob = sens)
  tmp <- binom.test(x, n, p = 0.5, alt = "greater")
  tmp$p.value < 0.05
}

전력의 추정치는

mean(replicate(nSim, runTest()))
[1] 0.887
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.