베이지안의 일반적인 적합도 검정은 무엇입니까?


25

물리적 관측치 (온도)와 숫자 모델 앙상블의 두 가지 데이터 세트가 있습니다. 모델 앙상블이 실제 독립적 인 표본을 나타내고 가정에서 해당 분포에서 관측치가 추출되는지 확인하는 완벽한 모델 ​​분석을 수행하고 있습니다. 내가 계산 한 통계는 정규화되었으며 이론적으로 표준 정규 분포 여야합니다. 물론 완벽하지는 않으므로 적합도를 테스트하고 싶습니다.

잦은 추론을 사용하여 Cramér-von Mises 통계 (또는 Kolmogorov-Smirnov 등) 또는 이와 유사한 것을 계산하고 p- 값을 얻기 위해 테이블에서 값을 찾아서 내가 얼마나 가치가 있는지를 결정하는 데 도움을 줄 수 있습니다. 관측치가 모형과 동일하다는 점을 참고하십시오.

이 과정과 베이지안의 내용은 무엇입니까? 즉,이 두 분포 (내 계산 된 통계량과 표준 정규 분포)가 다르다는 내 믿음의 강도를 어떻게 정량화 할 수 있습니까?


같은 뭔가 법안에 맞게 수 있습니다.
Cyan

답변:


23

나는 베이 즈 데이터 분석 (Bayesian Data Analysis) 책을 이 질문 (특히 6 장)과 내가 말하려는 모든 것에 대답하기위한 훌륭한 자료로 제안 할 것이다 . 그러나 베이지안이이 문제를 공격하는 일반적인 방법 중 하나는 PPP (Postior Predictive P-value)를 사용하는 것입니다. PPP가이 문제를 해결하는 방법으로 넘어 가기 전에 먼저 다음 표기법을 정의하겠습니다.

하자 관측 데이터하고 파라미터의 벡터 수. 우리는 를 관찰 할 수 있는 복제 된 데이터 로 정의 하거나, 또는 오늘 를 생산 한 실험이 동일한 모델과 동일한 방식으로 복제 된 경우 내일 보게 데이터로 예측할 있습니다. 관측 된 데이터를 생성 한 값 .θ y rep y θ와이θ와이대표와이θ

사후 예측 분포 현재 지식 상태를 고려하여 의 분포를 정의합니다. p ( y rep | y ) = Θ p ( y rep | θ ) p ( θ | y ) d θ와이대표

(와이대표|와이)=Θ(와이대표|θ)(θ|와이)θ

이제 검사 하고자하는 데이터의 측면 인 테스트 수량 을 정의하여 모델과 데이터 간의 불일치를 측정 할 수 있습니다 . 시험 량 또는 불일치 계수 , , 예측 시뮬레이션 데이터를 비교할 때 기준으로 사용되는 파라미터 데이터의 스칼라 요약이다. 테스트 수량은 베이지안 모델에서 역할을 수행하여 클래식 테스트에서 테스트 통계가 작동하는지 확인합니다. 데이터에만 의존하는 테스트 수량 인 테스트 통계에 대한 표기법 를 정의합니다 . 베이지안 맥락에서, 우리는 사후 분포 하에서 모형 모수에 의존 할 수 있도록 검정 통계량을 일반화 할 수 있습니다.T ( y )(와이,θ)(와이)

검정 통계량 의 p- 값 은 . 분포 위에 와 고정.P C = ( T ( Y 담당자 ) T ( Y ) | θ ) Y θ(와이)

기음=홍보((와이대표)(와이)|θ)
와이대표θ

베이지안 관점에서, 사후 예측 분포에 대한 데이터의 적합 부족은 시험 량의 꼬리 면적 확률 또는 p- 값에 의해 측정 될 수 있고, 의 사후 시뮬레이션을 사용하여 계산 될 수있다. . 베이지안 접근법에서, 테스트 수량은 알려지지 않은 파라미터의 사후 분포로부터 도출 된 것보다 평가되기 때문에 데이터뿐만 아니라 알려지지 않은 파라미터의 함수일 수있다.(θ,와이대표)

이제 테스트 수량에 의해 측정 된 것처럼 베이지안 p- 값 (PPP)을 복제 된 데이터가 관측 된 데이터보다 더 극단적 일 수있는 확률로 정의 할 수 있습니다. 여기서 의 사후 분포와 의 사후 예측 분포에 대한 확률을 취 합니다. 합동 분포 ) : 지시자 함수이다. 실제로 우리는 일반적으로 시뮬레이션을 사용하여 사후 예측 분포를 계산합니다.

=홍보((와이대표,θ)(와이,θ)|와이)
θ와이대표(θ,와이대표|와이)
=Θ나는(와이대표,θ)(와이|θ)(와이대표|θ)(θ|와이)와이대표θ,
나는

예를 들어, 의 사후 분포에서 시뮬레이션을 이미 가지고 있다면 , 각 시뮬레이션 된 대한 예측 분포에서 하나만 그릴 수 있습니다 . 이제 관절 후 분포 에서 추첨을합니다 . 사후 예측 검사는 실현 된 테스트 수량 과 예측 테스트 수량 입니다. 추정 된 p- 값은 테스트 수량이 실현 된 값과 같거나 초과하는 시뮬레이션 의 비율입니다 . 즉, 어느θ y rep θ L p ( y rep , θ | y ) T ( y , θ l ) T ( y rep l , θ l ) L T ( y rep l , θ l ) T ( y , θ l ) l = 1 , . . . , Lθ와이대표θ(와이대표,θ|와이)(와이,θ)(와이대표,θ)

(와이대표,θ)(와이,θ)
입니다 . =1,...,

전통적인 접근 방식과 달리 베이지안 모델 검사에는 "불량 매개 변수"를 처리하기위한 특별한 방법이 필요하지 않습니다. 사후 시뮬레이션을 사용하여 모델의 모든 매개 변수에 대해 내재적으로 평균을 내립니다.

추가 소스 인 Andrew Gelman은 PPP에 대한 훌륭한 문서를 제공합니다. http://www.stat.columbia.edu/~gelman/research/unpublished/ppc_understand2.pdf


3

하나의 상대적으로 간단한 가능성 : 예를 들어 [1] 의 적합도에 대한 부드러운 검정 -직교 다항식 (무게 함수로서의 널 밀도와 관련하여)에 의해 만들어지는 널로부터의 부드러운 편차에 대한 대안을 구성하는 것은 비교적 간단합니다. 다항식의 계수가 널의 유연하지만 매개 변수 확장을 형성하므로 베이지안 프레임 워크로 넘어갑니다.

[1] : Rayner, JCW 및 DJ Best (1990),
"적합성 양호 테스트 : 개요",
국제 통계 검토 , 58 : 1 (4 월), pp. 9-17

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.