답변:
당신이 요구하는 분포는 Poisson Binomial 분포 라고 불리우며 다소 복잡한 pmf가 있습니다 (더 자세한 설명은 Wikipedia 참조)
일반적으로 문제는 더 많은 시행 횟수 (일반적으로 시행 횟수가 초과하는 경우)에이 방정식을 사용할 수 없다는 것 입니다. pmf를 계산하는 다른 방법, 예를 들어 재귀 공식도 있지만 수치 적으로 불안정합니다. 이러한 문제를 해결하는 가장 쉬운 방법은 근사법입니다 (예 : Hong, 2013 ). 우리가 정의하면
소수의 법칙 또는 Le Cams 정리 를 통해 Poisson 분포 를 사용하여 pmf를 근사 할 수 있습니다.
그러나 일반적으로 이항 근사치가 더 잘 작동한다는 것을 알 수 있습니다 ( Choi and Xia, 2002 )
정규 근사를 사용할 수 있습니다
또는 cdf는 소위 정제 된 정규 근사법을 사용하여 근사 할 수 있습니다 (Volkova, 1996)
여기서 입니다.
다른 대안은 물론 Monte Carlo 시뮬레이션입니다.
간단한 dpbinom
R 함수는
dpbinom <- function(x, prob, log = FALSE,
method = c("MC", "PA", "NA", "BA"),
nsim = 1e4) {
stopifnot(all(prob >= 0 & prob <= 1))
method <- match.arg(method)
if (method == "PA") {
# poisson
dpois(x, sum(prob), log)
} else if (method == "NA") {
# normal
dnorm(x, sum(prob), sqrt(sum(prob*(1-prob))), log)
} else if (method == "BA") {
# binomial
dbinom(x, length(prob), mean(prob), log)
} else {
# monte carlo
tmp <- table(colSums(replicate(nsim, rbinom(length(prob), 1, prob))))
tmp <- tmp/sum(tmp)
p <- as.numeric(tmp[as.character(x)])
p[is.na(p)] <- 0
if (log) log(p)
else p
}
}
대부분의 방법 (및 그 이상)도 R poibin 패키지로 구현 됩니다.
첸, 리 (1974). 포아송 분포에 대한 포아송 이항의 수렴 확률의 연대기, 2 (1), 178-180.
Chen, SX 및 Liu, JS (1997). 포아송-바이 노미 및 조건부 베르누이 분포의 통계적 응용. Statistica Sinica 7, 875-892.
첸, SX (1993). 푸 아송-이항 분포, 조건부 베르누이 분포 및 최대 엔트로피. 기술 보고서. 하버드 대학교 통계학과
Chen, XH, Dempster, AP 및 Liu, JS (1994). 엔트로피를 최대화하기위한 가중 유한 모집단 샘플링. Biometrika 81, 457-469.
YH 왕 (1993). 독립 시험에서 성공한 횟수 Statistica Sinica 3 (2) : 295-312.
Hong, Y. (2013). 포아송 이항 분포의 분포 함수를 계산합니다. 전산 통계 및 데이터 분석, 59, 41-51.
Volkova, AY (1996). 독립적 인 무작위 지표의 합에 대한 중앙 한계 정리의 개선. 확률론과 그 적용 40, 791-794.
Choi, KP and Xia, A. (2002). 독립 실험에서 성공한 횟수의 근사치 : 이항 대 포아송. 적용 확률의 연대기, 14 (4), 1139-1148.
Le Cam, L. (1960). 포아송 이항 분포에 대한 근사 정리. Pacific Journal of Mathematics 10 (4), 1181-1197.