암 발생률과 관련된 모델링에 대한 예를 보여 드리고자합니다 (As in Johnson and Albert 1999). 관심있는 첫 번째 및 세 번째 요소에 닿습니다.
따라서 문제는 다양한 도시에서 암 발생률을 예측하는 것입니다. 다양한 도시 에있는 사람들의 수와 암 로 죽은 사람들의 수에 대한 데이터가 있다고 가정 해 봅시다 . 를 추정하고 싶다고 가정 . 그것들을 모델링하는 방법에는 여러 가지가 있으며 우리는 그들 각각에 문제가 있음을 알 수 있습니다. 유전 적 베이 모델링이 어떻게 몇 가지 문제를 극복 할 수 있는지 살펴 보겠습니다.
1. 한 가지 방법은 추정을 개별적으로 수행하는 것이지만, 희소 데이터 문제로 어려움을 겪을 것이며 낮은 대한 비율을 과소 평가할 것입니다 .엔나는엑스나는θ나는
엔나는
2. 희소 데이터의 문제를 관리하기위한 또 하나의 접근 방식 은 모든 도시에 대해 동일한 를 사용 하고 매개 변수를 연결하는 것이지만 매우 강력한 가정이기도합니다.
3. 수행 할 수있는 것은 모든 가 어떤면에서는 비슷하지만 도시 별 변형도 있습니다. 따라서 모든 가 공통 분포에서 도출되는 방식으로 모델링 할 수 있습니다 . 및 라고
합동 분포는 여기서 입니다. 우리는 를 추론해야한다θ나는
θ나는θ나는엑스나는~ B의 I N ( N나는, θ나는)θ나는~ B의 전자 t의 ( , B )
p ( D , θ , η| 엔) = p ( η) ∏엔나는 = 1B i n ( x나는| 엔나는, θ나는) B에 E t ( θ나는| η)η= ( a , b )η데이터에서. 상수에 고정되어 있으면 정보가 사이로 흐르지 않고 조건부로 독립적입니다. 그러나 를 알 수없는 것으로 취급함으로써 데이터가 적은 도시는 데이터가 많은 도시에서 통계적 강도를 빌릴 수 있습니다.
주요 아이디어는 하이퍼 파라미터의 불확실성을 모델링하기 위해 사전에 더 많은 베이지안을 설정하고 사전을 설정하는 것입니다. 이것은 이 예제에서 사이에 영향의 흐름을 허용 합니다.θ나는η
θ나는