편집 : 간단한 예제를 추가했습니다 : 의 평균 추론 . 또한 신뢰 구간과 일치하지 않는 신뢰할 수있는 구간이 나쁜 이유를 약간 설명했습니다.
나는 상당히 독실한 베이지안으로 일종의 믿음의 위기에 처해 있습니다.
내 문제는 다음과 같습니다. IID 데이터 를 분석하고 싶다고 가정하십시오 . 내가 할 일은 :
먼저, 조건부 모델을 제안하십시오 :
그런 다음 에서 이전을 선택하십시오 . P ( θ )
마지막으로 Bayes의 규칙을 적용하고 사후를 계산하십시오 : (또는 계산할 수없는 경우 근사치) 관한 모든 질문에 대답하십시오.θ
이것은 합리적인 접근법입니다 : 데이터 의 실제 모델 이 실제로 조건부 "내부"(일부 값 ) 인 경우 통계 결정 이론에 따라 내 방법이 허용된다고 말할 수 있습니다 (Robert 's 참조). 자세한 내용은 "베이지안 선택", "모든 통계"는 관련 장에서 명확한 설명을 제공합니다).θ 0
그러나 모두가 알고 있듯이 내 모델이 정확하다고 가정하는 것은 상당히 거만합니다. 왜 내가 고려한 모델의 상자 안에 자연이 깔끔하게 들어가야합니까? 그것은 데이터의 실제 모델이 있다고 가정하는 훨씬 더 현실적인 다르다 의 모든 값에 대해 . 이를 일반적으로 "미지정"모델이라고합니다.p ( X | θ ) θ
내 문제는 이보다 현실적인 잘못 지정 된 경우 베이지안 (즉, 사후 분포 계산)에 대한 좋은 주장은 단순히 최대 가능성 추정기 (MLE)를 계산하는 것과 관련이 없습니다.
실제로 Kleijn, vd Vaart (2012) 에 따르면 잘못 지정된 경우 사후 분포는 다음과 같습니다.
중심으로하는 배포판에 로 수렴θ M L
사후의 신뢰할 수있는 구간이 대한 신뢰 구간과 일치하는지 확인하기 위해 올바른 분산이 없습니다 (두 값이 동일하지 않은 경우) . (신뢰 구간은 분명히 베이지 안에서 지나치게 신경 쓰지 않는 것이지만, 이는 질적으로는 사후 분포가 본질적으로 잘못되었다는 것을 의미합니다. 신뢰할 수있는 구간은 정확한 적용 범위를 갖지 않기 때문입니다)
따라서 추가 속성이없는 경우 계산 프리미엄 (일반적으로 베이 시언 추론이 MLE보다 비싸다)을 지불하고 있습니다.
따라서 마지막으로 내 질문 : 모델이 잘못 지정되었을 때 더 간단한 MLE 대안에 대한 베이지안 추론을 사용하는 이론적이든 경험적이든 논란이 있습니까?
(내 질문이 불분명 한 경우가 많으므로 이해가되지 않는 경우 알려주세요. 문구를 바꾸려고합니다.)
편집 : 간단한 예를 생각해 봅시다 . 가우스 모델 에서 의 평균을 추론합니다 ( 추가 분산 을 위해 알려진 분산 ). 우리는 가우스 사전을 고려합니다 : 우리는 를 사전 평균, 의 역 분산으로 나타냅니다 . 의 실험적 평균 이라고하자 . 마지막으로, 주 : . σ μ 0 β 0 ˉ X X i μ = ( β 0 μ 0 + n
사후 분포는 다음과 같습니다.
올바르게 지정된 경우 ( 실제로 가우스 분포가있는 경우 )이 후자는 다음과 같은 멋진 속성을 갖습니다.
가 공유 분포가 이전 분포에서 선택되는 계층 적 모델에서 생성 된 경우 사후 신뢰할 수있는 구간은 정확한 적용 범위를 갖습니다. 데이터에 대한 조건부에서, 가 어떤 구간에있을 확률은 후부가이 구간에 귀속 될 확률과 같습니다 θ
사전이 정확하지 않더라도, 신뢰할 수있는 간격은 후부에 대한 사전 영향이 사라지는 한계 에서 정확한 범위를 갖습니다.
후자는 좋은 잦은 속성을 가지고 있습니다.
잘못 지정된 경우, 이러한 특성의 대부분은 이론에 의해 보장되지 않습니다. 아이디어를 고치기 위해 의 실제 모델 은 학생 분포 라고 가정합니다 . 우리가 보장 할 수있는 유일한 속성 (Kleijn et al)은 사후 분포 가 한계 에서 의 실제 평균에 집중한다는 것입니다 . 일반적으로 모든 적용 범위 속성이 사라집니다. 더 나쁜 것은 일반적으로 그 한계에서 적용 범위 속성이 근본적으로 잘못되었음을 보장 할 수 있습니다. 사후 분포는 다양한 공간 영역에 잘못된 확률을 부여합니다.X i n → ∞