답변:
간단히 말해서, 데이터에 대한 지식 이 거의 없거나 전혀 없을 때 평평하고 정보가없는 사전이 사용 되므로 분석 결과에 가장 적은 영향을 미칩니다 (즉, 후방 추론).
접합 분포는 이전 분포와 후방 분포가 동일한 분포이며, 이전은 접합체 이전이라고합니다. 대수적 편의성 , 특히 확률이 지수 패밀리 (Gaussian, Beta 등) 의 형태로 분포되어있을 때 대수적 편의를 위해 선호됩니다 . 이것은 Gibbs 샘플링을 사용하여 후방 시뮬레이션을 수행 할 때 매우 유용합니다.
마지막으로 모델의 매개 변수에 사전 분포가 설정되어 있지만 다른 수준의 복잡성 / 불확실성을 추가하려고합니다. 그런 다음 위에서 언급 한 이전의 매개 변수에 사전 분배를 적용하므로 이름이 hyper- prior 입니다.
Gelman의 베이지안 데이터 분석 은 베이지안 통계를 배우고 싶은 사람에게는 훌륭한 시작 이라고 생각합니다.
가장 높은 수준에서, 우리는 모든 방식의 선행을 연구원이 데이터 자체 밖에서 분석에 가져다 줄 정보의 양을 특정하는 것으로 생각할 수 있습니다. 데이터를보기 전에 어떤 매개 변수 값이 더 가능성이 있습니까?
베이지안 분석의 어두운 시대에, 베이지안이 빈번한 사람들과 싸울 때, 연구원은 가능한 한 이전에 분석을 통해 정보를 거의 제공하지 않을 것이라는 믿음이있었습니다. 따라서 사전이 어떻게 이런 방식으로 "비 정보"가 될 수 있는지 이해하는 데 많은 연구와 논쟁이있었습니다. 오늘 Gelman은 베이지안 데이터 분석 에서 비 정보적인 선행의 자동 선택에 반대한다고 주장합니다."비 정보"라는 설명은 이전의 "특별한"수학적 특징보다는 이전에 대한 그의 태도를 반영한다는 점. (또한 초기 문헌에는 이전의 정보가 어느 정도의 정보가 아닌지에 대한 질문이있었습니다. 나는 이것이 귀하의 질문에 특히 중요하다고 생각하지 않지만 잦은 관점 에서이 논쟁의 좋은 예는 시작 부분을 참조하십시오 게리 킹의 정치 방법론을 통일. )
"평평한"우선 순위는 범위 내의 모든 값이 똑같이 가능한 균일 한 우선 순위를 나타냅니다. 다시 말하지만, 모든 값이 똑같이 정보 일 가능성이 있고 모델이 매개 변수화되는 방법에 민감 할 수 있기 때문에 이것이 실제로 정보가 아닌지에 대한 논쟁이 있습니다. 평평한 선행은 베이지안 분석에서 오랜 역사를 가지고 있으며 베이지와 라플라스로 거슬러 올라갑니다.
"모호한"사전은 반드시 평평 할 필요는 없지만 고도로 확산되며, 특정 범위 주위에 확률 질량을 집중시키는 대신 넓은 범위의 값이 그럴듯하다는 것을 나타냅니다. 본질적으로, 이는 분산이 높은 사전입니다 (상황에서 "높은"분산이 의미하는 것).
공액 선행은 적절한 가능성을 곱하면 닫힌 형태의 표현을 생성하는 편리한 기능을 가지고 있습니다. 이것의 한 예는 이항 우도 이전의 베타 또는 포아송 우도 이전의 감마입니다. 인터넷과 Wikipedia에 유용한 테이블이 있습니다. 지수 패밀리는 이와 관련하여 매우 편리합니다.
컨쥬 게이트 선행 (conjugate priors)은 그들의 편리한 특성 때문에 일부 문제에 대해 종종 "기본 (default)"선택이지만, 이는 자신의 사전 지식이 컨쥬 게이트 (conjugate)를 통해 사전에 표현 될 수 없다면 반드시 "최고"를 의미하는 것은 아니다. 계산의 발전은 컨쥬 게이션이 예전처럼 가치가 없다는 것을 의미하므로 (참조 Gibbs sampling vs NUTS), 많은 문제없이 비컨 쥬 게이트 사전에 대한 추론을보다 쉽게 수행 할 수 있습니다.