베이지 안에서 잔차를 볼 수없는 이유는 무엇입니까?


46

"토론 : 생태 학자들이 베이지안이되어야합니까?"기사에서 브라이언 데니스 (Brian Dennis)는 베이 즈 통계를 사람들에게 경고하는 것으로 보이는 경우 놀랍도록 균형 잡힌 긍정적 인 견해를 제시합니다. 그러나 한 단락에서 인용이나 정당화없이 다음과 같이 말합니다.

베이지안에서는 잔차를 볼 수 없습니다. 모델이 얼마나 극단적인지에 따라 결과를 판단하는 가능성 원칙을 위반합니다. 베이지안에는 나쁜 모델이없고 단지 나쁜 믿음이 있습니다.

베이지 안에서 잔차를 볼 수없는 이유는 무엇입니까? 이에 대한 적절한 인용은 무엇입니까 (즉, 누가 인용하고 있습니까)?

Dennis, B.
토론 : 생태 학자들이 베이지안이되어야합니까?
생태 응용, 미국 생태 학회 , 1996 , 6, 1095-1103


6
그 주장이 효과가 있다면, 잦은 주의자들도 같은 이유로 가능성 원칙을 사용할 수 없었습니다.
Glen_b

@Glen : 빈번한 분석 가능성 원칙을 위반합니다.
Scortchi-Monica Monica 복원

3
@Glen : 잦은 주의자는 LP (약한 버전, Sufficiency Principle에 해당하는 약한 버전-종종 잦은 접근 방식과 호환되지 않음)를 보고 모델 확인을 피해야했습니다. 방금 그것을 존경하는 사람들은 지정된 모델의 매개 변수를 추정하는 작업에 사용할 수있을 때 기뻐하며 여전히 오래된 방법을 확인하기 위해 남은 방법-남은 부분-잔존물을 가지고 있습니다.
Scortchi-Monica Monica 복원

1
잦은 주의자가 ML 추정을 할 때에도 그는 추정치에 대한 신뢰 구간을 찾기 위해 MLE의 샘플링 분포를 고려하기 때문에 여전히 LP를 위반합니다.
Zen

2
@ 젠 : 신뢰 구간이 우도 함수를 통해서만 데이터에 의존 하는 한 약한 LP를 위반하지 않습니다 . 그러나 그는 다른 표본 추출 공간을 가진 다른 실험에서 동일한 우도 함수를 기반으로 다른 신뢰 구간을 만들어 강력한 LP를 위반할 수도 있습니다 .
Scortchi-Monica Monica 복원

답변:


19

물론 베이지안은 잔차를 볼 수 있습니다! 물론 베이지안 분석에는 잘못된 모델이 있습니다. 아마도 70의 지원되는 견해에있는 베이지안 몇 몇이 그런 식으로 의심 스럽지만 요즘에는이 견해를지지하는 베이지안을 거의 찾을 수 없을 것입니다.

나는 텍스트를 읽지 않았지만 베이지안은 모델을 비교하기 위해 베이 즈 요인과 같은 것을 사용합니다. 실제로 베이지안은 모형이 참일 확률을 계산하고 사실 일 가능성이 더 높은 모형을 선택할 수도 있습니다. 또는 베이지안은 더 나은 모델을 달성하기 위해 모델 간 평균을 계산할 수 있습니다. 또는 사후 예측 검사를 사용할 수 있습니다. 모델을 검사 할 수있는 많은 옵션이 있으며 각 모델은 하나의 접근 방식을 선호 할 수 있지만 베이지안 분석에 잘못된 모델이 없다고 말하는 것은 의미가 없습니다.

따라서 기껏해야 Bayesianism의 극단적 인 버전 (적용된 설정에서 거의 사용하지 않는 극단적 인 버전)에서는 모델을 확인할 수 없다고 말하는 것이 가장 적절합니다. 그러나 극단적 인 버전의 빈번한 상황에서는 관측 데이터도 사용할 수 없습니다. 그러나 이러한 어리석은 일에 대해 논의하는 데 왜 시간이 걸리는가? 적용 환경에서 언제 베이지안이나 빈번한 방법을 사용해야하는지에 관해 논의 할 수 있는가? 그것이 저의 겸손한 견해에서 중요한 것입니다.

업데이트 : OP는 극단적 인 버전의 Bayes를 옹호하는 사람에 대한 참조를 요청했습니다. Bayes의 극단적 인 버전을 읽지 않았으므로이 참조를 제공 할 수 없습니다. 그러나 나는 야만인이 그런 참고일지도 모른다고 생각합니다. 나는 그가 쓴 글을 읽지 않았기 때문에 틀릴 수도있다.

추신 : "잘 보정 된 베이지안"( Dawid (1982), JASA , 77 , 379 ) 의 문제에 대해 생각하십시오 . 일관된 주관 론자 베이지안 예측자는 교정 할 수 없으므로 교정되지 않았다는 엄청난 증거에도 불구하고 그의 모델 / 예측을 검토하지 않을 것입니다. 그러나 나는 실제로 누군가가 그 일관된 주장을 할 수 있다고 생각하지 않습니다. 따라서 모델 검토가 중요합니다.

ps2 .: Efron의이 논문도 좋아 합니다 . 자세한 내용은 Efron, Bradley (2005)입니다. "베이지안, 빈민가, 과학자." 미국 통계 협회 저널 100 (469).


5
나는 또한 금지가 실제로 심각하게 받아 들여지지 않았다고 가정했다. 그래서 나는 Gelman으로부터 이것을 읽은 것에 놀랐다 :- "나는 분명히 베이지안 통계에서 1990 년경 현재 상태로 돌아가고 싶지 않다. 데이터가 모델의 적합성을 확인하는 것은 불법입니다. "
Scortchi-Monica Monica 복원

1
90 년대의 베이지안 통계가 어땠는지 모르겠습니다. 그러나 적용된 설정에서 베이지안은 모델을 확인하지 않았다고 믿기가 어렵습니다. 어쩌면 그들은 확인했지만 말하지 않았습니다!
Manoel Galdino

2
당신 말이 맞을 것입니다 : 불법 특이한. 아마도 적어도 학계에서는 응용 프로그램에서 명백한 성공을 가리 키기보다는 원칙적으로 베이지안 방법을 방어하는 것이 더 일반적 이었기 때문에 (실제 또는 가정 된) 원칙에 대한 부적합은 양탄자 아래에 스윕 될 것입니다.
Scortchi-Monica Monica 복원

나는 이것이 주요한 문제가 아니라는 것에 동의한다. 이 "베이지주의의 극단적 인 버전"을 옹호하는 사람을 읽은 적이 있습니까?
Mankka

35

그들은 볼 수는 있지만 만질 수는 없습니다. 결국, 잔차는 모델 매개 변수에 대한 정보를 전달하지 않는 데이터의 일부이며, 이전의 모델 변수는 해당 변수에 대한 모든 불확실성을 나타냅니다. 데이터에서 보는 내용에 따라 사전을 변경할 수 없습니다.

예를 들어, 가우스 모형을 피팅하고 있지만 잔차에서 첨도가 너무 많다고 가정 해 봅시다. 아마도 당신의 이전의 가설은 낮은 자유도에 대해 0이 아닌 확률을 갖는 t- 분포 였어야했지만 그렇지 않았습니다. 그것은 사실상 무한한 자유도를 제외하고는 어디에서나 0의 확률을 갖는 t- 분포였습니다. 우연의 어느 것도 선행 밀도가 0 인 사후 밀도 영역에 대해 0이 아닌 확률을 초래할 수 없습니다. 따라서 원래 사전이 잘못 지정되면 데이터의 가능성을 기반으로 사전을 지속적으로 업데이트한다는 개념이 작동하지 않습니다.

물론 구글 "베이지안 모델 검사"라면 이것이 실제 베이지안 연습의 패러디임을 알 수 있습니다. 그럼에도 불구하고 그것은 철학적 근거에서 베이지안의 우월성에 대한 Logic of Science-논증에 어려움이 있음을 나타낸다 . Andrew Gelman의 블로그 는이 주제에서 흥미 롭습니다.


이 "논리의 난이도"에 대한 언급이 있습니까?
Mankka

7
나는 새로운 데이터가 들어올 때 확률 분포를 업데이트하기 위해 베이 즈 정리를 반복적으로 사용하는 것이 과학적 지식의 성장을위한 패러다임이라고 주장 하는 Jaynes, 확률 이론 : 과학의 논리를 언급 했다. 나는 그가 너무 좁은 이전의 문제를 다룰 것이라고 확신하지만 어떻게, 얼마나 만족스럽게 기억할 수는 없습니다. 그리고 저는 "일반 우위"를 "철학적 근거의 우위"로 바꾸려고합니다. 그것이 의미하는 바를 더 잘 전달하는 것 같습니다.
Scortchi-Monica Monica 복원

베이지안 사전 사용 의이 비 (非 ) 물리적 결과의 발생 (2 %)을 줄이기 위해 적용되었습니다 . 이러한 물리적 부족은 (신체 내 약물의) 비 물리적 인스턴트 믹싱에 기인 한 것으로 , 더 나은 모델을 사용하여 초기 혼합없다고 가정 하여 수정되었습니다 . 선입견에 따라 답변을 퍼지하는 것보다 문제에 모델을 적용하는 것이 좋습니다. (+1)
Carl
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.