나는 R의 중요도 샘플링 방법과 통합 평가 라는 질문에 대답하려고했습니다 . 기본적으로 사용자는 계산해야합니다
지수 분포를 중요도 분포로 사용
적분에 더 나은 근사값을 제공하는 값을 찾으십시오 . I는 평균값으로 평가 문제를 고쳐 의 통해 적분 후 그냥 : . self-study
따라서 를 의 pdf로 설정 하고 . 이제 목표는 추정하는 것입니다.
중요도 샘플링 사용. R에서 시뮬레이션을 수행했습니다.
# clear the environment and set the seed for reproducibility
rm(list=ls())
gc()
graphics.off()
set.seed(1)
# function to be integrated
f <- function(x){
1 / (cos(x)^2+x^2)
}
# importance sampling
importance.sampling <- function(lambda, f, B){
x <- rexp(B, lambda)
f(x) / dexp(x, lambda)*dunif(x, 0, pi)
}
# mean value of f
mu.num <- integrate(f,0,pi)$value/pi
# initialize code
means <- 0
sigmas <- 0
error <- 0
CI.min <- 0
CI.max <- 0
CI.covers.parameter <- FALSE
# set a value for lambda: we will repeat importance sampling N times to verify
# coverage
N <- 100
lambda <- rep(20,N)
# set the sample size for importance sampling
B <- 10^4
# - estimate the mean value of f using importance sampling, N times
# - compute a confidence interval for the mean each time
# - CI.covers.parameter is set to TRUE if the estimated confidence
# interval contains the mean value computed by integrate, otherwise
# is set to FALSE
j <- 0
for(i in lambda){
I <- importance.sampling(i, f, B)
j <- j + 1
mu <- mean(I)
std <- sd(I)
lower.CB <- mu - 1.96*std/sqrt(B)
upper.CB <- mu + 1.96*std/sqrt(B)
means[j] <- mu
sigmas[j] <- std
error[j] <- abs(mu-mu.num)
CI.min[j] <- lower.CB
CI.max[j] <- upper.CB
CI.covers.parameter[j] <- lower.CB < mu.num & mu.num < upper.CB
}
# build a dataframe in case you want to have a look at the results for each run
df <- data.frame(lambda, means, sigmas, error, CI.min, CI.max, CI.covers.parameter)
# so, what's the coverage?
mean(CI.covers.parameter)
# [1] 0.19
이 코드는 기본적으로 여기에 사용 된 표기법에 따라 중요도 샘플링의 간단한 구현입니다 . 그런 다음 중요도 샘플링을 번 반복하여 의 여러 추정값을 얻고 95 % 간격이 실제 평균을 포함하는지 여부를 확인할 때마다 확인합니다.
보다시피, 경우 실제 적용 범위는 0.19입니다. 를 과 같은 값으로 늘리 더라도 도움이되지 않습니다 (커버리지가 0.15보다 훨씬 작음). 왜 이런 일이 발생합니까?