데이터가 우선 순위를 지시 한 다음이 우선 순위를 사용하여 모델을 실행하도록 허용 하시겠습니까? (예 : 동일한 데이터 세트의 데이터 기반 우선 순위)


9

베이지안 분석에서 이전 분포가 어떻게 보이는지 정의 / 분석하기 위해 분석중인 동일한 데이터 세트를 허용해서는 안된다는 것을 이해하고 있습니다. 특히, 모형에 적합하도록 사전을 사용할 것과 동일한 데이터 세트의 요약 통계를 기반으로 베이지안 분석에 대한 사전 분포를 정의하는 것은 부적절합니다.

누군가 이것을 부적절하다고 구체적으로 논의하는 자원을 알고 있습니까? 이 문제에 대한 인용이 필요합니다.


답변:


11

예, 동일한 데이터를 두 번 사용하기 때문에 부적절한 결과를 초래하기 때문에 부적절합니다. 이것을 '더블 딥핑'이라고합니다.

참고로 저는 Carlin과 Louis (2000)로 시작할 것입니다. '더블 딥핑'이 경험적 베이 즈의 주요 비판 중 하나이지만 Ch. 이 책의 3 절 특히 3.5 절에서는 EB 접근법을 사용하여 적절한 신뢰 구간을 추정하는 방법을 설명합니다.

버거 J (2006). \ 객관적인 베이지안 분석 사례. "베이지안 분석, 1 (3), 385 {402

Bradley P. Carlin, Thomas A. Louis 2000. Bayes 및 Empirical Bayes 데이터 분석 방법.

Darniede, WF 2011. 데이터 의존적 사전에 대한 베이지안 방법. 오하이오 주립대 석사 학위 논문

Gelman, A., Carlin, JB, Stern, HS 및 Rubin, DB (2003), 베이지안 데이터 분석, 제 2 판 (통계 과학의 챕터 및 홀 / CRC 텍스트), 제 2 장 및 홀 / CRC 에드.


@sarah 질문을 되 찾을 수 있도록 계정을 등록하십시오. 이 URL을 방문하십시오. stats.stackexchange.com/users/login

1

이전 데이터를 작성하기 위해 데이터를 사용하는 것이 좋습니다.

혼합 모델링의 예는 Richardson & Green (1997) : http://citeseer.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.3667을 참조하십시오 .

그들은 데이터 포인트의 평균과 범위를 이전의 하이퍼 파라미터로 사용하며 완벽하게 이해됩니다.

데이터를 두 번 사용하는 문제는 유익한 사전 정보가 데이터에서 파생 될 때 발생한다고 생각합니다.

사후 분포가 피크 인 곳에서 이전 분포가 "평평한"상태인지 확인하는 한, 이전 분포가 결과에 큰 영향을 미치지 않는다는 것을 알고 있습니다.


데이터를 사용하여 사전을 구축하는 것은 베이지안 패러다임 내에서 이루어질 수 없습니다. 따라서 베이지안 관점에서는 이치에 맞지 않으며 베이지안 절차의 일반적인 검증은 적용되지 않습니다. 결과 추론은 완벽하게 유효 할 수 있지만 첫 번째 원칙에서이를 입증해야합니다. (Richardson과 Green은 경험적 Bayes를 사용합니다. 이것은 베이지안 절차가 아닙니다.)
Xi'an

베이지안 패러다임 내에서는 의미가 없지만 때로는 데이터와 이전의 것 사이의 구분선이 그리 어렵습니다. 내 대답을 참조하십시오 stats.stackexchange.com/questions/112451/...
할보 르센 kjetil B
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.