정규 및 이항 모형에서 항상 후방 분산이 이전 분산보다 작습니까?


10

또는 어떤 조건이이를 보장합니까? 일반적으로 (정상 및 이항 모델뿐만 아니라)이 주장을 일으킨 주된 이유는 샘플링 모델과 이전 모델 사이에 불일치가 있기 때문이라고 생각합니다. 이 주제로 시작하므로 쉬운 예제를 정말 고맙게 생각합니다

답변:


9

의 사후 및 이전 분산이 ( 샘플을 나타내는 ) 충족 하므로 모든 수량이 존재한다고 가정하면 사후 분산이 평균적으로 더 작을 것으로 예상 할 수 있습니다 ( ). 이것은 특히 에서 사후 분산이 일정한 경우입니다 . 그러나 다른 답변에서 볼 수 있듯이 결과가 기대에 불과하기 때문에 사후 분산의 더 큰 실현이있을 수 있습니다.θX

var(θ)=E[var(θ|X)]+var(E[θ|X])
XX

Andrew Gelman의 말을 인용하면

우리는 이것을 베이지안 데이터 분석 (Bayesian Data Analysis)의 2 장에서 고려해야 할 몇 가지 숙제 문제에 대해 생각합니다. 짧은 대답은 기대에 따라 더 많은 정보를 얻을수록 사후 분산이 감소하지만 모델에 따라 특히 분산이 증가 할 수 있다는 것입니다. 정규 및 이항과 같은 일부 모델의 경우 사후 분산 만 감소 할 수 있습니다. 그러나 자유도가 낮은 t 모형 (공통 평균과 다른 분산을 가진 법선의 혼합으로 해석 할 수 있음)을 고려하십시오. 극단 값을 관찰하면 분산이 높고 실제로 후방 분산이 증가 할 수 있다는 증거입니다.


@Xian, 내 "답변"을 살펴볼 수 있습니까? 겔만 및 베이지안 통계에 대해 뭔가를 말한다면, 나는 훨씬 더 ... 자신보다 당신을 신뢰하는 경향입니다
크리스토프 Hanck

1
우리의 대답 사이에 충돌이 없습니다. BDA 에는 예제에 해당 하는 운동도 있습니다 . 즉, 베타 후방 분산이 이전 분산보다 크게 설정되는 데이터를 찾습니다.
시안

흥미로운 후속 질문은 다음과 같습니다. 표본 크기가 증가함에 따라 분산이 0으로 수렴되는 조건은 무엇입니까?
Julien

8

이것은 @ Xi'an에게 답보다 더 많은 질문이 될 것입니다.

사후 분산 와 시행 횟수가, 성공 회수와 전에 베타 계수, 종래 분산 넘는 은 아래 예를 기반으로하는 이항 모형에서도 가능합니다. 이전은 뚜렷한 대조를 이루기 때문에 후부는 "너무 멀리있다". Gelman의 인용과 모순되는 것 같습니다.

V(θ|y)=α1β1(α1+β1)2(α1+β1+1)=(α0+k)(nk+β0)(α0+n+β0)2(α0+n+β0+1),
nkα0,β0
V(θ)=α0β0(α0+β0)2(α0+β0+1)
n <- 10         
k <- 1
alpha0 <- 100
beta0 <- 20

theta <- seq(0.01,0.99,by=0.005)
likelihood <- theta^k*(1-theta)^(n-k) 
prior <- function(theta,alpha0,beta0) return(dbeta(theta,alpha0,beta0))
posterior <- dbeta(theta,alpha0+k,beta0+n-k)

plot(theta,likelihood,type="l",ylab="density",col="lightblue",lwd=2)

likelihood_scaled <- dbeta(theta,k+1,n-k+1)
plot(theta,likelihood_scaled,type="l",ylim=c(0,max(c(likelihood_scaled,posterior,prior(theta,alpha0,beta0)))),ylab="density",col="lightblue",lwd=2)
lines(theta,prior(theta,alpha0,beta0),lty=2,col="gold",lwd=2)
lines(theta,posterior,lty=3,col="darkgreen",lwd=2)
legend("top",c("Likelihood","Prior","Posterior"),lty=c(1,2,3),lwd=2,col=c("lightblue","gold","darkgreen"))

 > (postvariance <- (alpha0+k)*(n-k+beta0)/((alpha0+n+beta0)^2*(alpha0+n+beta0+1)))
[1] 0.001323005
> (priorvariance <- (alpha0*beta0)/((alpha0+beta0)^2*(alpha0+beta0+1)))
[1] 0.001147842

따라서이 예는 이항 모형에서 더 큰 후방 분산을 제안합니다.

물론 이것은 예상되는 후방 편차가 아닙니다. 불일치가있는 곳입니까?

해당 수치는

여기에 이미지 설명을 입력하십시오


4
완벽한 그림. 그리고 실현 된 사후 분산이 이전 분산보다 더 크다는 사실과 기대치가 더 작다는 사실 사이에는 차이가 없습니다.
시안

1
나는 또한 여기 에서 논의되고있는 것에 대한 훌륭한 예 로써이 답변에 대한 링크를 제공했다 .
Don Slowik 2016 년
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.