후부는 이전과 가능성과 매우 다릅니다


21

이전과 가능성이 서로 매우 다른 경우, 때때로 후부가 그들과 유사하지 않은 상황이 발생합니다. 정규 분포를 사용하는이 그림을 참조하십시오.

후 행동

이것은 수학적으로 정확하지만 내 직감과 일치하지 않는 것 같습니다. 데이터가 내 견실 한 신념이나 데이터와 일치하지 않으면 범위가 잘 맞지 않을 것으로 예상되며 평소보다 뒤 떨어질 것으로 기대합니다 이전과 가능성에 대한 전체 범위 또는 아마도 이봉 분포 (어떤 논리적 인 의미가 있는지 확실하지 않습니다). 나는 내 이전의 신념이나 데이터와 일치하지 않는 범위에서 단단히 후미를 기대하지 않을 것입니다. 더 많은 데이터가 수집되면 후자는 가능성을 향해 움직일 것이지만,이 상황에서는 반 직관적 인 것처럼 보입니다.

내 질문은 :이 상황에 대한 나의 이해가 어떻게 결함이 있는지 (또는 결함이 있는지)입니다. 이 상황에서 후자는 '올바른'기능입니까? 그렇지 않은 경우 어떻게 모델링 할 수 있습니까?

완전성을 기하기 위해 선행은 이고 가능성은 입니다.N(μ=1.5,σ=0.4)N(μ=6.1,σ=0.4)

편집 : 주어진 답변 중 일부를 보면 상황을 잘 설명하지 않은 것 같습니다. 내 요점은 베이지안 분석 이 모델의 가정을 감안할 때 직관적이지 않은 결과를 산출하는 것 같습니다 . 내 생각에 그 후자는 아마도 잘못된 모델링 결정을 어떻게 설명해야할지에 대한 생각이었다. 나는 이것을 대답으로 확장시킬 것이다.


2
그것은 단순히 당신이 후부의 정상 성을 가정 할 수 없다는 것을 의미합니다. 후방이 정상이라고 가정하면 실제로 맞습니다.
PascalVKooten

나는 사후에 대해 아무런 가정도하지 않았으며, 이전과 가능성 만 가정했다. 어쨌든 분포 형태는 여기서 무의미 해 보입니다. 수동으로 그릴 수 있었고 같은 후부가 뒤따를 것입니다.
Rónán Daly

나는 만약 당신이 후부가 정상이라고 가정하지 않는다면이 후부에 대한 당신의 믿음을 버릴 것이라고 말하고 있습니다. 정상적인 이전 및 정상 데이터를 고려할 때 정상적인 후부는 실제로 이와 같습니다. 아마도 작은 데이터를 상상해보십시오. 실제로 이와 같은 것이 실제로 발생할 수 있습니다.
PascalVKooten

1
이 수치가 맞습니까? 이전 의 가능성 는 결코 겹치지 않기 때문에 0에 매우 가까워 야합니다. 이전의 무게가 0에 매우 가까워서 후부가 어떻게 볼 수 있는지 보는 데 어려움이 있습니다. 뭔가 빠졌습니까? ×
Luca

1
@Luca 당신은 재 정규화를 잊고 있습니다. 이전과 우도의 곱은 0에 가까우지만 다시 정규화하면 다시 1에 통합되면 관련이 없습니다.
Pat

답변:


5

그렇습니다. 이러한 상황이 발생할 수 있으며 특히 이전 및 샘플링 모델 (우연성)에서 정규성 모델링 가정의 특징입니다. 대신에 이전에 Cauchy 분포를 선택한 경우, 후방이 훨씬 다르게 보일 것입니다.

prior = function(x) dcauchy(x, 1.5, 0.4)
like = function(x) dnorm(x,6.1,.4)

# Posterior
propto = function(x) prior(x)*like(x)
d = integrate(propto, -Inf, Inf)
post = function(x) propto(x)/d$value

# Plot
par(mar=c(0,0,0,0)+.1, lwd=2)
curve(like, 0, 8, col="red", axes=F, frame=T)
curve(prior, add=TRUE, col="blue")
curve(post, add=TRUE, col="seagreen")
legend("bottomleft", c("Prior","Likelihood","Posterior"), col=c("blue","red","seagreen"), lty=1, bg="white")

코시 이전의 일반적인 샘플링 모델


귀하의 답변 @jaradniemi에 감사드립니다. Cauchy 사전에 항상 질문에 주어진 특정 상황을 피할 것이라고 생각하십니까?
Rónán Daly

1
예. 일반적으로 두꺼운 꼬리 사전은 데이터가 이전보다 더 쉽게 압도 할 수있게합니다.
jaradniemi

2
jaradniemi, 그럴 수도 있지만, 사후에 영향을 미치기 전에 사전에 정보를 선택하는 이유는 무엇입니까? 유익한 것처럼 보이기 때문에 cauchy를 선택하는 것이 좋습니다. 그러나 실제로는 그렇지 않습니다.
Florian Hartig

1
이전과 가능성이 일치하면 사후 이전보다 원하는 정확도가 향상되므로 이전은 유익합니다. 그러나 두꺼운 꼬리를 가진 사전을 선택하면 두 사람이 동의하지 않을 때 이전을 쉽게 압도 할 수 있습니다.
jaradniemi 2019

2

나는 지금까지 주어진 대답에 다소 동의하지 않습니다.이 상황에는 이상한 것이 없습니다. 어쨌든 가능성은 무의식적으로 정상이며 정상적인 선행은 전혀 드문 일이 아닙니다. 이전과 가능성이 같은 답변을 제공하지 않는다는 사실과 함께 두 가지를 모두 합치면 여기에서 논의 할 상황이 있습니다. 나는 jaradniemi의 코드로 아래를 묘사했습니다.

우리는 1) 그러한 관측의 일반적인 결론은 a) 모델이 구조적으로 잘못되었다. b) 데이터가 잘못되었다는 것이다. 그러나 무언가가 확실하지 않으며, 어쨌든해야 할 사후 예측 검사를 수행하는 경우에도이를 볼 수 있습니다.

1 Hartig, F .; 다이크, 제이; 히 클러, T .; 히긴스, SI; 오하라, RB; Scheiter, S. & Huth, A. (2012) 역동적 인 초목 모델을 데이터에 연결-반대 관점. J. Biogeogr., 39, 2240-2252. http://onlinelibrary.wiley.com/doi/10.1111/j.1365-2699.2012.02745.x/abstract

prior = function(x) dnorm(x,1,.3)
like = function(x) dnorm(x,-1,.3)

# Posterior
propto = function(x) prior(x)*like(x)
d = integrate(propto, -Inf, Inf)
post = function(x) propto(x)/d$value

# Plot
par(mar=c(0,0,0,0)+.1, lwd=2)
curve(like, -2, 2, col="red", axes=F, frame=T, ylim = c(0,2))
curve(prior, add=TRUE, col="blue")
curve(post, add=TRUE, col="seagreen")
legend("bottomleft", c("Prior","Likelihood","Posterior"), col=c("blue","red","seagreen"), lty=1, bg="white")

여기에 이미지 설명을 입력하십시오


2

나는이 질문에 관해서 내가 찾고있는 대답이 Bayesian Biostatistics의 Lesaffre와 Lawson에 의해 가장 잘 요약되어 있다고 생각합니다.

후방 정밀도 즉, 이전 및 샘플 정밀도의 합이다 :

1σ2=w0+w1
μσ

이것이 저를 위해 요약하고 다른 답변에서 개략적으로 설명하는 것은 정상적인 가능성으로 정규 사전을 모델링하는 경우 후방이 어느 쪽보다 더 정확한 상황을 초래할 수 있다는 것입니다. 이것은 반 직관적이지만 이러한 방식으로 이러한 요소를 모델링 한 결과입니다.


이는 Fisher 매트릭스를 통해 더 높은 차원으로 일반화됩니다. 최고점에 가까운 사후 분포의 로그 가능성에 대한 헤 시안은 이전 및 가능성 역 공분산의 합입니다. 이 합의 역수는 후부의 공분산입니다. 2 개의 양의 (반) 정정 행렬 (역공 분산)이 더해 지므로, 사후의 정밀도는 이전 또는 가능성 확률 분포의 정밀도를 초과 할 것입니다. 이는 베이지안 프레임 워크에서 보편적 인 결과입니다.
T3am5hark

2

모형이 올 바르면 이전에서 멀어 질 가능성 함수를 관찰하는 것은 거의 불가능합니다. 데이터 보기 전에 상황을 상상해보십시오 . 과거 데이터의 정확한 추론에 근거X1X0μN(1.6,0.42)X1N(μ,0.42)X1X10.42+0.42=0.562ϕ((6.11.6)/0.56)=9.31016μ

간단히하기 위해 "과거 데이터"도 단일 변량 X0N(μ,0.42)X0X0X1|X1X0|>6.11.6

X0X1


1

이것에 대해 잠시 생각한 후에, 잘못된 결론을 내렸을 때 후자는 이전의 믿음이나 가능성과 일치하지 않는 결과가 될 수 있다는 결론을 내 렸습니다. 이것으로부터 자연적인 결과는 후부가 일반적으로 분석의 끝 이 아닙니다 . 후부가 데이터에 대략적으로 맞아야하거나 이전과 가능성 사이에 확산되어야하는 경우 (이 경우), 사후 예측 검사 등으로 사실을 확인해야합니다. 비슷한. 이것을 모델에 통합하려면 확률 론적 진술에 확률을 두는 능력이 필요한 것 같습니다.


예, 동의, 내 더 자세한 답변을 참조
플로리안 Hartig

0

나는 이것이 실제로 흥미로운 질문이라고 생각합니다. 그것을 잤다, 나는 대답에 찌르는 것 같아요. 주요 문제는 다음과 같습니다.

  • 당신은 그 가능성을 가우스 pdf로 취급했습니다. 그러나 그것은 확률 분포가 아닙니다-그것은 가능성입니다! 또한 축 레이블을 명확하게 지정하지 않았습니다. 이러한 것들이 합쳐져서 뒤 따르는 모든 것을 혼란스럽게했습니다.

μσP(μ|μ,σ)μσP(X|μ,σ)XP(μ|X,σ,μ,σ)μ

그러나 가로축이 μP(X|μ)

P(μ|μ,σ)=exp((μμ)22σ2)12πσ2

P(X|μ,σ)=i=1Nexp((xiμ)22σ2)12πσ2

σ2=σ2/Nσ2NX

따라서 이전과 가능성은 똑같이 유익합니다. 왜 후부 이봉이 아닌가? 이것은 모델링 가정 때문입니다. 이것이 설정되는 방식 (정상 이전, 정상 우도)에서 암시 적으로 정규 분포를 가정했으며, 이는 후방이 단조로운 대답을하도록 제한합니다. 그것은 정규 분포의 속성 일뿐입니다. 그것들을 사용함으로써 문제를 일으켰습니다. 다른 모델이이 작업을 수행하지 않았을 수도 있습니다. 나는 코시 분포가 여러 모달 가능성을 가질 수 있고 따라서 여러 모달 후부를 가질 수 있다는 느낌을 가지고있다.

따라서 우리는 단합이되어야하며, 이전은 가능성만큼 유익합니다. 이러한 제약 조건 하에서 가장 합리적인 추정치는 가능성과 이전 사이의 직접 지점처럼 들리기 시작합니다. 그러나 왜 후방이 더 단단해 집니까?

σμσσσμ

(이를 시각화하는 방법은 단지 두 개의 샘플 포인트를 사용하여 알려진 분산으로 가우스 평균을 추정하는 것을 상상하는 것일 수 있습니다. 두 샘플 포인트가 가우스 너비보다 훨씬 더 많이 분리되어있는 경우 (즉, 바깥에 있음) 꼬리에서), 그 의미는 실제로 그 사이에 평균이 있다는 강력한 증거입니다.이 위치에서 평균을 약간 조금 이동하면 한 샘플 또는 다른 샘플의 확률이 기하 급수적으로 떨어집니다.)

요약하면, 당신이 묘사 한 상황은 약간 이상하며, 모델을 사용하여 당신이 알지 못했던 문제에 몇 가지 가정 (예 : 단일성)을 포함 시켰습니다. 그러나 그렇지 않으면 결론은 맞습니다.


μσσμ
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.