초대 된 사람의 결혼식에 대한 결정이 독립적이라고 가정하면, 결혼식에 올 손님의 수는 반드시 성공 확률이 반드시 같지 않은 Bernoulli 랜덤 변수의 합으로 모델링 할 수 있습니다. 이것은 포아송 이항 분포에 해당합니다 .
하자 에서 당신의 결혼식에 올 것이다 사람의 총 수에 해당하는 임의의 변수가 될 명을 초대했다. 예상되는 참가자 수는 실제로 개별 '' ''확률 , 즉
신뢰 구간의 도출은 확률 질량 함수 형식으로 간단하지 않습니다 . 그러나 몬테카를로 시뮬레이션 으로 근사하기 쉽습니다 .N p i E ( X ) = N ∑ i = 1 p i .XNpi
E(X)=∑i=1Npi.
다음 그림은 230 명의 초대 된 사람 (왼쪽)에 대한 일부 가짜 표시 확률을 사용하여 10000 개의 시뮬레이션 된 시나리오 (오른쪽)를 기반으로 결혼식에 참가자 수를 분배하는 예를 보여줍니다. 이 시뮬레이션을 실행하는 데 사용되는 R 코드는 다음과 같습니다. 신뢰 구간의 근사값을 제공합니다.
## Parameters
N <- 230 # Number of potential guests
nb.sim <- 10000 # Number of simulations
## Create example of groups of guests with same show-up probability
set.seed(345)
tmp <- hist(rbeta(N, 3, 2), breaks = seq(0, 1, length.out = 21))
p <- tmp$breaks[-1] # Group show-up probabilities
n <- tmp$counts # Number of person per group
## Generate number of guests by group
guest.mat <- matrix(NA, nrow = nb.sim, ncol = length(p))
for (j in 1:length(p)) {
guest.mat[, j] <- rbinom(nb.sim, n[j], p[j])
}
## Number of guest per scenario
nb.guests <- apply(guest.mat, 1, sum)
## Result summary
par(mfrow = c(1, 2))
barplot(n, names.arg = p, xlab = "Probability group", ylab = "Group size")
hist(nb.guests, breaks = 21, probability = TRUE, main = "", xlab = "Guests")
par(mfrow = c(1, 1))
## Theoretical mean and variance
c(sum(n * p), sum(n * p * (1-p)))
#[1] 148.8500 43.8475
## Sample mean and variance
c(mean(nb.guests), var(nb.guests))
#[1] 148.86270 43.23657
## Sample quantiles
quantile(nb.guests, probs = c(0.01, 0.05, 0.5, 0.95, 0.99))
#1% 5% 50% 95% 99%
#133.99 138.00 149.00 160.00 164.00