설명하는 문제는 타당성이 아닌 해석 문제입니다. 상수 추정기의 부트 스트랩 바이어스 추정값이 유효하지 않습니다. 실제로 완벽합니다.
바이어스 부트 스트랩 추정값 추정기 사이 θ = S ( X ) 및 파라미터 θ = t ( F ) , 여기서, F는 미지의 분포이며, X 의 샘플 F를 . 함수 t ( F ) 는 모집단이 있다면 원칙적으로 계산할 수있는 것입니다. 언젠가는 우리가 받아 들 ( X ) = t ( F ) , 플러그인의 추정 t (θ^=s(x)θ=t(F),FxFt(F)s(x)=t(F^), 경험적 분포 사용하여 F 의 장소에서 F를 . 이것은 아마도 위에서 설명한 것입니다. 모든 경우에 바이어스 부트 스트랩 추정은
b를 I A는 s의 F = E F [ S ( X * ) ] - t ( F ) ,
여기서, X *는 발 스트랩 샘플이다 X는 .t(F)F^F
biasF^=EF^[s(x∗)]−t(F^),
x∗x
상수 완벽한 플러그인 같은 일정에 대한 추정치이다 :c 인구가 샘플 ~ F 에 근접, 경험적 분포, F를 . 평가할 수 있다면 t ( F ) = C를 , 당신은 얻을 것 C를 . 당신이 플러그인 추정 계산하면 t ( F를 ) = c를 당신은 또한 얻을 C를 . 예상대로 편견이 없습니다.∼F∼F^Ft(F)=cct(F^)=cc
플러그인 추정에 바이어스가 잘 알려진 경우 따라서, 추정 분산의 베셀의 보정이다. 아래에서 이것을 보여줍니다. 부트 스트랩 바이어스 추정치는 나쁘지 않습니다.
t(F^)
library(plyr)
n <- 20
data <- rnorm(n, 0, 1)
variance <- sum((data - mean(data))^2)/n
boots <- raply(1000, {
data_b <- sample(data, n, replace=T)
sum((data_b - mean(data_b))^2)/n
})
# estimated bias
mean(boots) - variance
#> [1] -0.06504726
# true bias:
((n-1)/n)*1 -1
#> [1] -0.05
대신 를 모집단 평균과 s ( x ) = c로 취할 수 있습니다. 대부분의 경우 명확한 편견이 있어야합니다.
t(F)s(x)=c
library(plyr)
mu <- 3
a_constant <- 1
n <- 20
data <- rnorm(n, mu, 1)
boots <- raply(1000, {
# not necessary as we will ignore the data, but let's do it on principle
data_b <- sample(data, n, replace=T)
a_constant
})
# estimated bias
mean(boots) - mean(data)
#> [1] -1.964877
# true bias is clearly -2
다시 한 번 부트 스트랩 추정치는 나쁘지 않습니다.