정규 분포 데이터의 평균 및 분산을 추정하기 위해 여러 연구의 정보 결합-베이지안 대 메타 분석 접근법


21

나는 각각의 알려진 크기 표본에서 측정의 관측 평균과 SD를보고하는 일련의 논문을 검토했습니다 . 나는 내가 설계하고있는 새로운 연구에서 같은 측정법의 가능한 분포와 그 추측에 얼마나 많은 불확실성이 있는지에 대해 최선의 추측을하고 싶습니다. ) 이라고 가정 합니다.n X ~ N ( μ , σ 2엑스엑스(μ,σ2

저의 첫 번째 생각은 메타 분석이었습니다. 그러나 모델은 일반적으로 점 추정치 및 해당 신뢰 구간에 중점을 둡니다. 그러나 의 전체 분포에 대해 말하고 싶습니다 .이 경우 분산에 대한 추측도 포함 됩니다. σ 2엑스σ2

나는 사전 지식에 비추어 주어진 분포의 전체 모수 세트를 추정하기위한 가능한 Bayeisan 접근법에 대해 읽었습니다. 이것은 일반적으로 나에게 더 의미가 있지만 베이지안 분석에 대한 경험이 없습니다. 이것은 또한 치아를 자르는 간단하고 비교적 간단한 문제처럼 보입니다.

1) 내 문제가 주어지면 어떤 접근법이 가장 합리적이며 왜 그럴까요? 메타 분석 또는 베이지안 접근?

2) 베이지안 접근법이 가장 좋다고 생각한다면, 이것을 구현하는 방법을 알려 줄 수 있습니까 (바람직하게는 R에서)?

관련 질문

EDITS :

나는 '단순한'베이지안 방식이라고 생각하는 방식 으로이 작업을 시도했습니다.

위에서 언급했듯이 추정 된 정보 뿐만 아니라 사전 정보, 즉 에 비추어 분산 에 관심이 있습니다.σ 2 P ( μ , σ 2 | Y )μσ2(μ,σ2|와이)

다시 한 번, 베이에 이즘에 대해서는 전혀 알지 못하지만, 평균과 분산이 알려지지 않은 정규 분포의 후부 는 정규-역 감마 분포와 함께 공액 을 통해 닫힌 형태의 솔루션을 가지고 있음을 찾는 데 오래 걸리지 않았습니다 .

문제는 로 재구성됩니다 .(μ,σ2|와이)=(μ|σ2,와이)(σ2|와이)

(μ|σ2,와이) 는 정규 분포로 추정됩니다. 역 감마 분포를 갖는 .(σ2|와이)

내 머리를 가져다 놓는 데 시간이 걸렸지만이 링크 ( 1 , 2 )에서 R 에서이 작업을 수행하는 방법을 정렬 할 수 있다고 생각했습니다.

33 개 연구 / 샘플 각각에 대한 행과 평균, 분산 및 표본 크기에 대한 열로 구성된 데이터 프레임으로 시작했습니다. 첫 번째 연구의 평균, 분산 및 표본 크기를 행 1의 사전 정보로 사용했습니다. 그런 다음 다음 연구의 정보로 이것을 업데이트하고 관련 매개 변수를 계산하고 normal-inverse-gamma에서 샘플링하여 및 의 분포를 얻습니다 . 이것은 33 개의 연구가 모두 포함될 때까지 반복됩니다.σ 2μσ2

# Loop start values values

  i <- 2
  k <- 1

# Results go here

  muL      <- list()  # mean of the estimated mean distribution
  varL     <- list()  # variance of the estimated mean distribution
  nL       <- list()  # sample size
  eVarL    <- list()  # mean of the estimated variance distribution
  distL    <- list()  # sampling 10k times from the mean and variance distributions

# Priors, taken from the study in row 1 of the data frame

  muPrior  <- bayesDf[1, 14]    # Starting mean
  nPrior   <- bayesDf[1, 10]    # Starting sample size
  varPrior <- bayesDf[1, 16]^2  # Starting variance

  for (i in 2:nrow(bayesDf)){

# "New" Data, Sufficient Statistics needed for parameter estimation

    muSamp    <- bayesDf[i, 14]          # mean
    nSamp     <- bayesDf[i, 10]          # sample size
    sumSqSamp <- bayesDf[i, 16]^2*(nSamp-1)  # sum of squares (variance * (n-1))

# Posteriors

    nPost   <- nPrior + nSamp
    muPost  <- (nPrior * muPrior + nSamp * muSamp) / (nPost)  
    sPost   <- (nPrior * varPrior) + 
                sumSqSamp + 
               ((nPrior * nSamp) / (nPost)) * ((muSamp - muPrior)^2)
    varPost <- sPost/nPost
    bPost   <- (nPrior * varPrior) + 
                sumSqSamp + 
               (nPrior * nSamp /  (nPost)) * ((muPrior - muSamp)^2)
# Update 

    muPrior   <- muPost
    nPrior    <- nPost
    varPrior  <- varPost

# Store

    muL[[i]]   <-  muPost
    varL[[i]]  <-  varPost
    nL[[i]]    <-  nPost
    eVarL[[i]] <- (bPost/2) / ((nPost/2) - 1)

# Sample

    muDistL  <- list()  
    varDistL <- list()

    for (j in 1:10000){
      varDistL[[j]] <- 1/rgamma(1, nPost/2, bPost/2)
      v             <- 1/rgamma(1, nPost/2, bPost/2)
      muDistL[[j]]  <- rnorm(1, muPost, v/nPost)
    }

# Store 

    varDist    <- do.call(rbind, varDistL)
    muDist     <- do.call(rbind, muDistL)
    dist       <- as.data.frame(cbind(varDist, muDist))
    distL[[k]] <- dist

# Advance

    k <- k+1 
    i <- i+1

  }

  var     <- do.call(rbind, varL)
  mu      <- do.call(rbind, muL)
  n       <- do.call(rbind, nL)
  eVar    <- do.call(rbind, eVarL)
  normsDf <- as.data.frame(cbind(mu, var, eVar, n)) 
  colnames(seDf) <- c("mu", "var", "evar", "n")
  normsDf$order <- c(1:33)

다음은 각각의 새 샘플이 추가 될 때 및 어떻게 변경되는지 보여주는 경로 다이어그램 입니다.이자형(μ)이자형(σ2)

여기에 이미지 설명을 입력하십시오

다음은 각 업데이트에서 평균 및 분산에 대한 추정 된 분포에서 샘플링 한 것입니다.

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

다른 사람에게 도움이되는 경우를 대비 하여이 내용을 추가하고 싶었으므로 알지 못하는 사람들이 이것이 합리적이고 결함이 있는지 등을 알 수 있습니다.

답변:


11

두 가지 접근 방식 (메타 분석 및 베이지안 업데이트)은 실제로 그다지 고유하지 않습니다. 메타 분석 모델은 실제로 베이지안 모델로 구성되는 경우가 많으며, 현재의 현상에 대한 사전 지식 (아마도 모호한)에 증거를 추가한다는 아이디어는 자연스럽게 메타 분석에 적합하기 때문입니다. 이 연결을 설명하는 기사는 다음과 같습니다.

MT, 브랜 닉 (2001). 테스트 검증을위한 경험적 Bayes 메타 분석의 의미. 응용 심리학 저널, 86 (3) , 468-480.

(저자는 메타 분석의 결과 척도로 상관 관계를 사용하지만 원칙에 상관없이 원칙은 동일하다).

메타 분석을위한 베이지안 방법에 대한보다 일반적인 기사는 다음과 같습니다.

Sutton, AJ, & Abrams, KR (2001). 메타 분석 및 증거 합성의 베이지안 방법. 의료 연구의 통계적 방법, 10 (4) , 277-303.

당신이 쫓아 온 것 (일부 결합 된 추정치 외에)은 미래 연구에서 실제 결과 / 효과가 떨어질 가능성을 나타내는 예측 / 신뢰성 구간입니다. "전통적인"메타 분석 또는 베이지안 메타 분석 모델로부터 그러한 간격을 얻을 수있다. 전통적인 접근 방식은 예를 들어 다음과 같습니다.

Riley, RD, Higgins, JP, & Deeks, JJ (2011). 무작위 효과 메타 분석의 해석. 영국 의학 저널, 342 , d549.

베이지안 모델의 컨텍스트 (인출, 예를 들면, 랜덤 효과 모델 튼 및 브람스, 2001 년 논문에서 식 (6)에 의해 설명 됨), 하나는 쉽게의 사후 분포를 얻을 수 여기서 참이다 번째 연구 의 결과 / 효과 (이러한 모델은 일반적으로 MCMC를 사용하여 추정되므로 적절한 번인 기간 후에 대해 체인을 모니터링하면 됩니다). 그런 후의 분포로부터 신뢰 구간을 얻을 수 있습니다.θ나는θ나는나는θ나는


3
그 외에도 많은 베이지안은 메타 분석의 결과로 만들어졌습니다.
Fomite

2

와이나는j(μ,σ2)나는=1,...jj=1,...,케이μ

μ^=1j=1케이j와이¯j,=j=1케이j.
σσ2
σ~2=1케이j=1케이(j1)에스j2
케이
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.