여러 대치 후 후방 평균과 신뢰할 수있는 간격을 어떻게 모을 수 있습니까?


20

여러 대치를 사용하여 여러 개의 완성 된 데이터 집합을 얻었습니다.

완성 된 각 데이터 집합에 베이지안 방법을 사용하여 모수에 대한 사후 분포를 얻었습니다 (임의의 효과).

이 매개 변수의 결과를 어떻게 결합 / 풀링 할 수 있습니까?


더 많은 맥락 :

내 모델은 학교에 모인 개별 학생 (학생 당 한 번의 관찰)의 의미에서 계층 적입니다. 데이터 계층을 대치에 통합하기 위해 누락 된 데이터에 대한 예측 변수 중 하나로 MICE포함 된 내 데이터에 대해 여러 대치 ( R을 사용하여 )를 수행했습니다 school.

완성 된 각 데이터 세트에 간단한 랜덤 슬로프 모델을 적용 MCMCglmm했습니다 (R에서 사용 ). 결과는 이진입니다.

랜덤 슬로프 분산의 사후 밀도는 다음과 같은 의미로 "잘 동작합니다". 여기에 이미지 설명을 입력하십시오

이 임의의 효과에 대해 각 대치 된 데이터 집합의 사후 수단과 신뢰할 수있는 간격을 어떻게 결합 / 풀링 할 수 있습니까?


업데이트 1 :

내가 지금까지 이해 한 바에 따르면, 사후 평균에 Rubin의 규칙을 적용하여 후대 평균을 곱할 수 있습니다.이 작업에 문제가 있습니까? 그러나 95 %의 신뢰할 수있는 간격을 어떻게 결합 할 수 있는지 전혀 모른다. 또한 각 대치에 대한 실제 후방 밀도 샘플이 있으므로 어떻게 든 결합 할 수 있습니까?


업데이트 2 :

의견에 대한 @cyan의 제안에 따르면, 나는 다중 대치에서 각 완전한 데이터 세트에서 얻은 사후 분포의 샘플을 단순히 결합하는 아이디어를 매우 좋아합니다. 그러나 나는 이것을하기위한 이론적 정당성을 알고 싶습니다.


주어진 데이텀의 누락이 관련 결과 값과 무관 한 경우, 다른 대치 된 데이터 세트에서 모든 사후 샘플을 함께 던지고 결합 된 사후 샘플의 평균 및 95 % 신뢰할 수있는 간격을 취하는 것이 맞습니다.
Cyan

@Cyan은 누락 메커니즘이 "임의로 누락"또는 "임의로 완전 누락"이지만 "무작위로 누락되지 않음"(MI 수행에 대해 배운 일반적인 가정)이 아니라고 말하는 것과 동일합니까? 이 "함께 던지는 것"이 ​​공식적으로 정당화되는 참조가 있습니까?
Joe King

다중 대치는 베이지안 절차의 핵심입니다. 추정을 위해 베이지안 방법을 사용하는 경우 (MCMC 등) 완전 베이지안 모델에 대한 추가 MCMC 샘플링 단계로 누락 된 데이터의 시뮬레이션을 던져야하며 이러한 접근 방식 간의 인터페이스를 고려하지 않아도됩니다.
StasK

@StasK 귀하의 의견에 감사드립니다. 다음 프로젝트에서이 방법을 사용하려고하지만 불행히도 지금 모델을 변경할 시간이 없습니다. 나는 이미 각 대치 된 데이터 집합에 대해 대치 및 베이지안 모델을 실행했습니다. 실행하는 데 거의 3 주가 걸렸습니다. 사후 샘플을 결합하는 것이 유효하지 않다고 생각합니까?
Joe King

루빈의 규칙은 순간에만 적용됩니다. 의미있는 방식으로 배포판에 적용 할 수 있는지 모르겠습니다. 그럴 수도 있고 아닐 수도 있고. MCMC 실행에서 점 추정치 (후방 평균)와 표준 오차 (후방 분산)를 생성 한 다음 Rubin의 규칙을 사용하여 전체 점 및 분산 추정치를 얻는 것이 가장 좋습니다. 계층 적 모델에서 df의 손실이 얼마나 비극적인지, 그리고 데이터를 풀링하는 것이 얼마나 위험한지 알 수 있습니다. 각각에 5 개의 완전한 데이터 세트와 1M MCMC 샘플이있는 경우 5M iid MCMC가 아닌 5 개의 클러스터가 있음을 의미합니다 전철기.
StasK

답변:


4

분포에 대한 모수 적 설명으로 적절하게 설명 할 수있는 특히 잘 작동하는 사후를 사용하면 사후를 가장 잘 나타내는 평균과 분산을 간단히 취하고 거기서 나올 수 있습니다. 나는 이것이 정말로 이상한 사후 분포를 얻지 못하는 많은 상황에서 적절하다고 생각합니다.


0

stata를 사용하는 경우 혼합 효과 모델을 사용하여 대치 후 데이터를 풀링하는 "mim"이라는 절차가 있습니다. R에서 사용할 수 있는지 모르겠습니다.


고맙습니다. 잘 설명하지 않았을 수도 있습니다. 여러 개의 대치 된 데이터 세트에서 이미 사후 샘플이 있으며 간단히 이들을 결합한 다음 여러 번 대치 된 신뢰할 수있는 간격을 형성 할 수 있는지 알고 싶습니다.
Joe King
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.