"모델 불확실성"세계에서 내가 찾은 흥미로운 것 중 하나는 "진정한 모델"이라는 개념입니다. 이것은 내재적으로 "모델 제안"이 다음과 같은 형식임을 의미합니다.
M(1)i:The ith model is the true model
여기에서 사후 확률 합니다. 이 절차는 개념적 수준에서 매우 모호한 것 같습니다. 제안이 철저 하다고 가정하는 것은 큰 부름 (또는 불가능한 계산) 입니다. 생산할 수있는 모든 모델 세트에는 아직 생각하지 못한 대체 모델이있을 것입니다. 그리고 무한 회귀도 마찬가지입니다 ...P(M(1)i|DI)M(1)i
여기에서는 확률이 1에 더해 지므로 모델을 소외시킬 수 있기 때문에 철저 함이 중요합니다.
그러나 이것은 모두 개념적 수준입니다. 모델 평균화는 우수한 성능을 제공합니다. 따라서 이것은 더 나은 개념이 있어야 함을 의미합니다.
개인적으로 모델을 망치 나 드릴과 같은 도구로 본다. 모델은 우리가 관찰 할 수있는 것을 예측하거나 설명하는 데 사용되는 정신적 구성물입니다. "진정한 망치"와 "진정한 정신 구성"을 말하는 것도 마찬가지로 이상한 소리입니다. 이를 바탕으로 "진정한 모델"이라는 개념이 이상하게 보입니다. "올바른"모델과 "잘못된"모델보다는 "좋은"모델과 "나쁜"모델을 생각하는 것이 훨씬 더 자연스러운 것 같습니다.
이러한 관점을 고려할 때, 우리는 선택된 모델 중에서 "사용하기 가장 좋은"모델에 대해 불확실 할 수 있습니다. 그러므로 우리가 대신에 퇴비에 대해 추론한다고 가정하자.
M(2)i:Out of all the models that have been specified,
the ith model is best model to use
이제 이것은 "모델 불확실성"에 대해 생각하는 훨씬 더 좋은 방법입니다. 우리는 어떤 모델이 "올바른"것이 아니라 어떤 모델을 사용해야하는지 확실하지 않습니다. 이것은 또한 모델 평균화가 더 나은 일처럼 보이게합니다 (어쨌든 나에게). 그리고 내가 알 수있는 한, BIC를 사용 하는 후자는 거칠고 쉬운 근사치로서 완벽하게 좋습니다. 또한, 제안 은 독점적 일뿐 만 아니라 철저 합니다.M(2)iM(2)i
그러나이 방법에서는 "최상의"모델이 얼마나 좋은지 측정하기 위해 일종의 적합도 측정법이 필요합니다. 이는 일반적인 GoF 통계 (KL 발산, 카이-제곱 등)에 해당하는 "확실한 것"모델에 대해 테스트하여 두 가지 방법으로 수행 할 수 있습니다. 이를 측정하는 또 다른 방법은 모델 클래스에 매우 유연한 모델을 포함시키는 것입니다. 수백 가지 구성 요소가 포함 된 일반 혼합 모델 또는 Dirichlet 프로세스 혼합입니다. 이 모델이 최고로 나오면 다른 모델이 부적절 할 수 있습니다.
이 백서 는 이론적으로 잘 설명되어 있으며 실제로 모델 선택을 수행하는 방법에 대한 예를 단계별로 설명합니다.