많은 규모 의 강력한 추정기 가 존재한다 . 주목할만한 예로는 표준 편차와 의 중앙값 절대 편차가 있습니다. 베이지안 프레임 워크에는 대략 정규 분포 (예 : 특이 치로 오염 된 정규 분포) 의 위치 를 강력하게 추정 할 수있는 여러 가지 방법이 있습니다. 예를 들어 데이터가 분포 또는 라플라스 분포에서와 같이 분포되어 있다고 가정 할 수 있습니다. 이제 내 질문 :
대략적인 정규 분포 의 척도 를 강력한 방식으로 측정하기위한 베이지안 모델 은 MAD 또는 이와 유사한 견고성 추정기와 같은 의미에서 어떻게 강력합니까?
MAD의 경우와 마찬가지로 데이터 분포가 실제로 정규 분포 인 경우 베이지안 모형이 정규 분포의 SD에 접근 할 수 있다면 깔끔 할 것입니다.
편집 1 :
데이터 가정 할 때 오염 / 아웃 라이어에 강하다는 모델의 전형적인 예 인 대략 같은 분포를 사용하는 정상 :
어디 평균이며, 규모이며, 정도-의 자유입니다. 및 에 대한 적절한 우선 순위를 갖는 경우 , 은 특이 치에 대해 강건한 의 평균 추정치입니다 . 단, 의 SD 일관된 추정치 없습니다 로 에 따라 . 예를 들어, 가 4.0으로 고정되고 위의 모형이 분배 후 약 0.82 일 것이다. 내가 찾고있는 것은 t 모델과 같이 견고하지만 평균 대신 SD에 대한 SD 모델입니다.
편집 2 :
다음은 위에서 언급 한 t- 모델이 평균에 대해 어떻게 더 강력한 지에 대한 R 및 JAGS의 코드화 된 예입니다.
# generating some contaminated data
y <- c( rnorm(100, mean=10, sd=10),
rnorm(10, mean=100, sd= 100))
#### A "standard" normal model ####
model_string <- "model{
for(i in 1:length(y)) {
y[i] ~ dnorm(mu, inv_sigma2)
}
mu ~ dnorm(0, 0.00001)
inv_sigma2 ~ dgamma(0.0001, 0.0001)
sigma <- 1 / sqrt(inv_sigma2)
}"
model <- jags.model(textConnection(model_string), list(y = y))
mcmc_samples <- coda.samples(model, "mu", n.iter=10000)
summary(mcmc_samples)
### The quantiles of the posterior of mu
## 2.5% 25% 50% 75% 97.5%
## 9.8 14.3 16.8 19.2 24.1
#### A (more) robust t-model ####
library(rjags)
model_string <- "model{
for(i in 1:length(y)) {
y[i] ~ dt(mu, inv_s2, nu)
}
mu ~ dnorm(0, 0.00001)
inv_s2 ~ dgamma(0.0001,0.0001)
s <- 1 / sqrt(inv_s2)
nu ~ dexp(1/30)
}"
model <- jags.model(textConnection(model_string), list(y = y))
mcmc_samples <- coda.samples(model, "mu", n.iter=1000)
summary(mcmc_samples)
### The quantiles of the posterior of mu
## 2.5% 25% 50% 75% 97.5%
##8.03 9.35 9.99 10.71 12.14