왜 후방 밀도가 이전 밀도 시간 우도 함수에 비례합니까?


11

베이 즈 정리에 따르면 입니다. 그러나 내 계량 텍스트에 따르면 라고 말합니다 . 왜 이런가요? 가 무시되는 이유를 모르겠습니다 .P ( θ | Y ) α P ( Y | θ ) P ( θ ) P ( Y )P(y|θ)P(θ)=P(θ|y)P(y)P(θ|y)P(y|θ)P(θ)P(y)


1
이 둘이 동일하지만 비례 적이라고 말하지는 않는다 ( )1/P(y)
jpmuc

4
P(y) 는 무시되지 않고 상수로 취급 되는데 이는 문제에 대해 수정 된 데이터 의 함수이기 때문입니다 . 만약 여기서, (에 의존하지 의미 상수 ), 우리가 쓸 수 해당하는 단지 수단 는 (지정되지 않은) 상수입니다. 와 의 극한값은 동일한 위치에서 발생하므로 에서 최대 사후 확률 (MAP 또는 MAPP) 추정값을 찾을 수 있습니다. 를 알거나 계산할 필요가 없습니다 . yA(x)=cB(x)cxA(x)B(x)A(x)B(x)A(x)B(x)P(yθ)P(θ)P(y)
Dilip Sarwate

답변:


14

Pr(y) 의 한계 확률 "무시."되지 단순히 일정합니다. 나누면 P r ( y | θ ) P ( θ ) 계산이 적절한 확률, 즉 [ 0 , 1 ] 간격 으로 측정되도록 "리 스케일링"하는 효과 가 있습니다 . 이 스케일링이없는 경우에도 여전히 유효한 상대 측정 값이지만 [ 0 , 1 ] 간격으로 제한되지는 않습니다 .yPr(y)Pr(y|θ)P(θ)[0,1][0,1]

종종 "탈락"되어 있기 때문에 P의 R ( Y ) = P R ( Y | θ ) P R ( θ ) D θ는 평가하기 어려운 경우가 많습니다, 그리고 간접적으로 통합을 수행하는 것이 편리 충분하다 시뮬레이션을 통해.Pr(y)Pr(y)=Pr(y|θ)Pr(θ)dθ


11

그것을주의해라

P(θ|y)=P(θ,y)P(y)=P(y|θ)P(θ)P(y).

의 밀도 계산에 관심이 있으므로이 매개 변수에 의존하지 않는 함수 ( 예 : P ( y )) 는 버릴 수 있습니다. 이것은 당신에게θP(y)

P(θ|y)P(y|θ)P(θ).

를 버린 결과, 이제 밀도 P ( θ | y )θ 영역에서 1에 대한 적분과 같은 일부 특성을 잃어 버렸습니다 . 일반적으로 가능성 함수를 통합하는 데 관심이 없지만이를 최대화하는 데 관심이 있기 때문에 이는 큰 문제가 아닙니다. 그리고 함수를 최대화 할 때이 함수에 상수를 곱하면 (베이지안 접근에서는 데이터 y 가 고정됨 을 기억하십시오) 최대 점에 해당하는 θ 가 변경되지 않습니다 . 값을 변경합니다P(y)P(θ|y)θyθ최대 우도의 값을 갖지만 다시 한 번, 각 의 상대적 위치에 관심이 있습니다.θ

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.