확률이 다른 베르누이 시험의 성공


11

각각 20 개의 독립적 인 베르누이 (Beroulli) 시험이 각각 다른 성공 확률로 수행되므로 실패합니다. 20 번의 시행 중 정확히 n 번이 성공했을 확률은 얼마입니까?

성공 확률과 실패 확률의 조합을 단순히 합하는 것보다 이러한 확률을 계산하는 더 좋은 방법이 있습니까?

답변:


12

당신이 요구하는 분포는 Poisson Binomial 분포 라고 불리우며 다소 복잡한 pmf가 있습니다 (더 자세한 설명은 Wikipedia 참조)

Pr(X=x)=AFxiApijAc(1pj)

일반적으로 문제는 더 많은 시행 횟수 (일반적으로 시행 횟수가 초과하는 경우)에이 방정식을 사용할 수 없다는 것 입니다. pmf를 계산하는 다른 방법, 예를 들어 재귀 공식도 있지만 수치 적으로 불안정합니다. 이러한 문제를 해결하는 가장 쉬운 방법은 근사법입니다 (예 : Hong, 2013 ). 우리가 정의하면n=30

μ=i=1npi

σ=i=1npi(1pi)

γ=σ3i=1npi(1pi)(12pi)

소수의 법칙 또는 Le Cams 정리 를 통해 Poisson 분포 를 사용하여 pmf를 근사 할 수 있습니다.

Pr(X=x)μxexp(μ)x!

그러나 일반적으로 이항 근사치가 더 잘 작동한다는 것을 알 수 있습니다 ( Choi and Xia, 2002 )

Pr(X=x)Binom(n,μn)

정규 근사를 사용할 수 있습니다

f(x)ϕ(x+0.5μσ)

또는 cdf는 소위 정제 된 정규 근사법을 사용하여 근사 할 수 있습니다 (Volkova, 1996)

F(x)max(0, g(x+0.5μσ))

여기서 입니다.g(x)=Φ(x)+γ(1x2)ϕ(x)6

다른 대안은 물론 Monte Carlo 시뮬레이션입니다.

간단한 dpbinomR 함수는

dpbinom <- function(x, prob, log = FALSE,
                    method = c("MC", "PA", "NA", "BA"),
                    nsim = 1e4) {

  stopifnot(all(prob >= 0 & prob <= 1))
  method <- match.arg(method)

  if (method == "PA") {
    # poisson
    dpois(x, sum(prob), log)
  } else if (method == "NA") {
    # normal
    dnorm(x, sum(prob), sqrt(sum(prob*(1-prob))), log)
  } else if (method == "BA") {
    # binomial
    dbinom(x, length(prob), mean(prob), log)
  } else {
    # monte carlo
    tmp <- table(colSums(replicate(nsim, rbinom(length(prob), 1, prob))))
    tmp <- tmp/sum(tmp)
    p <- as.numeric(tmp[as.character(x)])
    p[is.na(p)] <- 0

    if (log) log(p)
    else p 
  }
}

대부분의 방법 (및 그 이상)도 R poibin 패키지로 구현 됩니다.


첸, 리 (1974). 포아송 분포에 대한 포아송 이항의 수렴 확률의 연대기, 2 (1), 178-180.

Chen, SX 및 Liu, JS (1997). 포아송-바이 노미 및 조건부 베르누이 분포의 통계적 응용. Statistica Sinica 7, 875-892.

첸, SX (1993). 푸 아송-이항 분포, 조건부 베르누이 분포 및 최대 엔트로피. 기술 보고서. 하버드 대학교 통계학과

Chen, XH, Dempster, AP 및 Liu, JS (1994). 엔트로피를 최대화하기위한 가중 유한 모집단 샘플링. Biometrika 81, 457-469.

YH 왕 (1993). 독립 시험에서 성공한 횟수 Statistica Sinica 3 (2) : 295-312.

Hong, Y. (2013). 포아송 이항 분포의 분포 함수를 계산합니다. 전산 통계 및 데이터 분석, 59, 41-51.

Volkova, AY (1996). 독립적 인 무작위 지표의 합에 대한 중앙 한계 정리의 개선. 확률론과 그 적용 40, 791-794.

Choi, KP and Xia, A. (2002). 독립 실험에서 성공한 횟수의 근사치 : 이항 대 포아송. 적용 확률의 연대기, 14 (4), 1139-1148.

Le Cam, L. (1960). 포아송 이항 분포에 대한 근사 정리. Pacific Journal of Mathematics 10 (4), 1181-1197.


0

한 가지 방법은 생성 기능을 사용하는 것입니다. 문제의 해결책 은 다항식 의 계수 입니다.xn

i=120(pix+1pi).

이것은 Tim의 답 (지수 시간이 됨)에서 Poisson Binomial 분포에서 합산을 수행하는 동적 프로그래밍에 해당하는 (베르누이 변수 수의 2 차 시간)입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.