베이지안 관점에서 부트 스트랩을 해석 할 수 있습니까?


43

좋아, 이것은 밤에 나를 유지시키는 질문이다.

부트 스트랩 절차를 베이지안 부트 스트랩을 제외한 일부 베이지안 절차와 비슷하게 해석 할 수 있습니까?

나는 정말 통일되고 이해하기 쉬운 통계의 베이지안 "통역"을 정말 좋아합니다. 그러나 나는 또한 부트 스트랩 절차에 약점이있어 매우 간단하지만 많은 상황에서 합리적인 추론을 제공합니다. 부트 스트랩이 어떤 의미에서 사후 분포와 비슷하다는 것을 알고 있다면 부트 스트랩에 더 만족할 것입니다.

나는 "Bayesian 부트 스트랩"(Rubin, 1981)을 알고 있지만 부트 스트랩의 버전은 표준 부트 스트랩만큼 문제가된다고 생각합니다. 문제는 클래식과 베이지안 부트 스트랩을 수행 할 때 가능한 분포 값이 이미 본 값일 뿐이라는 매우 독특한 모델 가정입니다. 이러한 이상한 모델 가정이 어떻게 부트 스트랩 절차에서 얻을 수있는 매우 합리적인 추론을 얻을 수 있습니까? 부트 스트랩의 속성을 조사한 기사를 찾고 있었지만 (예 : Weng, 1989), 내가 만족하는 명확한 설명을 찾지 못했습니다.

참고 문헌

도널드 비 루빈 (1981). 베이지안 부트 스트랩. 앤 통계 학자. 9 권 1 호 130-134

정성원 (1989). 베이지안 부트 스트랩 평균의 2 차 점근 법 속성. 통계의 연대기 , Vol. 17, No. 2, 705-710 쪽.


3
방금 부트 스트랩의 베이지안 "설명"을 탐구하는 "베이 즈 모델로서의 부트 스트랩"( sumsar.net/blog/2015/04/… ) 에 대한 블로그 게시물을 작성했습니다 . 위의 질문에 직접 대답하지는 않지만 부트 스트랩이 무엇이며 무엇을하는지 명확하게하기를 바랍니다.
Rasmus Bååth

muliere 및 secchi (1996) 베이지안 비모수 적 예측 추론 및 부트 스트랩 기술을 읽으십시오. Thay는 당신의 요점을 정확하게 지적합니다!

답변:


30

Hastie, Tibshirani 및 Friedman의 통계 학습 요소 8.4 절은 "부트 스트랩과 베이지안 추론의 관계"입니다. 그것은 당신이 찾고있는 것일 수도 있습니다. 이 책은 스탠포드 웹 사이트를 통해 자유롭게 구할 수 있다고 생각합니다.

편집하다:

다음은 저자가 온라인으로 자유롭게 이용할 수있는 책에 대한 링크입니다.

http://www-stat.stanford.edu/~tibs/ElemStatLearn/

272 페이지에서 저자는 다음과 같이 씁니다.

이런 의미에서 부트 스트랩 분포는 모수에 대한 (대략적인) 비모수 적, 비 정보적인 사후 분포를 나타냅니다. 그러나이 부트 스트랩 분포는 사전에 공식적으로 지정하지 않고 후방 분포에서 샘플링 할 필요없이 고통없이 얻을 수 있습니다. 따라서 우리는 부트 스트랩 배포를 "가난한"베이 즈 후부로 생각할 수 있습니다. 데이터를 교란시킴으로써 부트 스트랩은 매개 변수 교란의 베이지안 효과에 근사하며 일반적으로 수행하기가 훨씬 간단합니다.

Dvoretzky–Kiefer–Wolfowitz 부등식 을 언급하는 이 교차 검증 된 질문 에서 퍼즐의 한 조각이 더 발견되는데, 이는 경험적 분포 함수가 확률 적으로 기하 급수적으로 빠른 실제 분포 함수에 균일하게 수렴한다는 [...]을 나타냅니다.

따라서 모든 비모수 적 부트 스트랩은 "우리의 모수에 대해 (대략적인) 비모수 적, 비 정보 적 후부 분포"를 생성하고 표본 수가 증가함에 따라이 근사치가 "지수 적으로 빠르다"는 점근 법 방법으로 볼 수 있습니다.


3
관련 자료에 대한 언급은 항상 감사하지만 해당 섹션에 대한 간략한 요약이 포함되어 있으면이 답변이 크게 향상 될 것입니다.
추기경

1
해당 섹션의 마지막 비트가 더 유용 할 수 있습니다. 부트 스트랩은 추정 된 모수에 대한 대략적인 비모수, 비 정보 후부 분포입니다. 전체 섹션을 읽을 가치가 있습니다.
Fraijo

2
링크 주셔서 감사합니다! 내가 Hastie et al. 오른쪽은 비모수 적 부 스트랩과 베이지안 부트 스트랩 사이의 대응 관계를 보여 주며 전자가 후자를 근사한다고 주장합니다. 그들은 왜 부트 스트랩 (베이지안이든 아니든)이 처음에 합리적인 추론을하는지에 대해 많이 쓰지 않습니다. 내가 기대했던 것은 "[일부 일반적인 상황에서] 부트 스트랩은 [뭔가] 그리고 [이것과 저것에 의존하는] 오류로 매개 변수 / 통계의 실제 사후 분포에 근사합니다."
Rasmus Bååth

답변을 개선하는 데 도움을 주셔서 감사합니다. 부트 스트랩이 작동하는 이유에 대해 들어 본 가장 명확한 설명은 방금 수집 한 샘플이 전체 모집단에 대해 가장 잘 표현 된 것입니다. 그러나 나는 그것을 더 공식적으로 표현하기에는 전문가가 충분하지 않습니다.
EdM

내가 기억한다면, 그들은이 주장을하고 NN을 부트 스트랩하고 Radford Neal이 완전히 베이지안 NN에 크림을 바르게됩니다. 나는 그것이 무언가를 말하고 있다고 생각합니다.
guy

3

이 주제에서 내가 본 최신 논문입니다.

@article{efr13bay,
author={Efron, Bradley},
title={Bayesian inference and the parametric bootstrap},
journal={Annals of Applied Statistics},
volume=6,
number=4,
pages={1971-1997},
year=2012,
doi={10.1214/12-AOAS571},
abstract={Summary: The parametric bootstrap can be used for the efficient
    computation of Bayes posterior distributions. Importance sampling formulas
    take on an easy form relating to the deviance in exponential families and
    are particularly simple starting from Jeffreys invariant prior. Because of
    the i.i.d. nature of bootstrap sampling, familiar formulas describe the
    computational accuracy of the Bayes estimates. Besides computational
    methods, the theory provides a connection between Bayesian and frequentist
    analysis. Efficient algorithms for the frequentist accuracy of Bayesian
    inferences are developed and demonstrated in a model selection example.},
keywords={Jeffreys prior; exponential families; deviance; generalized linear
    models},
classmath={*62F15 (Bayesian inference)
62F40 (Resampling methods)
62J12 (Generalized linear models)
65C60 (Computational problems in statistics)}}

2
논문에 대한 나의 해석은 특정 모델의 후방 분포를 계산하기위한 부트 스트랩 방법, 즉 대도시 샘플링 대신에 사용될 수있는 방법을 설명한다는 것이다. 나는이 논문이 비모수 적 부트 스트랩 모델 가정과 베이지안 추정 사이의 연관성을 논의하는 것을 보지 못한다.
Rasmus Bååth

1
그렇게 주장합니다. 나는 논문을 자세히 읽지 않았습니다.
Frank Harrell

5
Frank : 저는 Efron이이 논문을 읽지 못했습니다. 그가하는 것은 가능성에서 시작하여 후부 (종종 잘 작동 함)에 도달하려고하는 순차 중요도 샘플러로 볼 수 있습니다. 1981 년 논문에서 루빈의 목적은 부트 스트랩의 적합성에 의문을 제기하는 것이었지만 Efron은 분명히 반대의 견해에 도달했습니다. David Draper는 이번 여름 그의 JSM 과정에서 그것을 수정하고 샘플에서 가능성의 대부분을 볼 때를 제외하고는 나쁜 결론을 내 렸습니다. 그러나 normaldeviate.wordpress.com/2013/06/12/…
phaneron

1

저 역시 부트 스트랩과 베이 즈 정리에 유혹을 받았지만, 베이 즈 관점에서 볼 때까지 부트 스트랩의 정당화에 대해 많은 이해를 할 수 없었습니다. 그런 다음 아래에서 설명하는 것처럼 부트 스트랩 분포는 베이지안 후부 분포로 볼 수 있는데, 이는 부트 스트랩 뒤에 (a?) 근거를 분명히하고, 가정을 명확하게하는 이점을가집니다. https://arxiv.org/abs/1803.06214(22-26 페이지) 에는 아래의 주장과 가정에 대한 자세한 내용이 있습니다 .

예를 들어, http://woodm.myweb.port.ac.uk/SL/resample.xlsx 의 스프레드 시트에 설정되어있는 경우 (화면 하단의 부트 스트랩 탭 클릭) 스프레드 시트를 사용하여이 샘플을 대체하여 1000 개의 리 샘플을 생성하고 평균을 가장 가까운 짝수로 반올림했을 때이 평균의 82 개는 54 개였습니다. 부트 스트랩의 아이디어는 우리가 9의 표본 평균이 얼마나 가변적 일지 알기 위해 표본을 "척수"모집단으로 사용하므로 표본 평균의 확률이 모집단 평균보다 6이 낮을 가능성이 있음을 나타냅니다 (이 경우 척도 모집단은 평균 60)의 샘플은 8.2 %입니다. 리샘플링 히스토그램의 다른 막대에 대해서도 비슷한 결론을 내릴 수 있습니다.

이제 실제 모집단의 평균이 66이라는 사실을 상상해 봅시다. 이것이 그렇다면 표본 평균이 60 (즉, 데이터) 일 확률의 추정치는 8.2 %입니다 (위 단락의 결론을 사용하여) 60은 가정 된 인구 평균 66보다 6 아래 6입니다). 이것을 다음과 같이 작성하자

P (평균 데이터 = 66) = 8.2 %

이 확률은 리샘플링 분포의 x 값 54에 해당합니다. 같은 종류의 인수는 0, 2, 4 ... 100의 가능한 모든 모집단 평균에 적용됩니다. 각 경우에 확률은 리샘플링 분포에서 비롯되지만이 분포는 평균 60에 대해 반영됩니다.

이제 베이 즈 정리를 적용 해 봅시다. 해당 측정 값은 0에서 100 사이의 값만 사용할 수 있으므로 가장 가까운 짝수로 반올림하면 모집단 평균의 가능성은 0, 2, 4, 6, .... 100입니다. 사전 분포가 평평하다고 가정하면, 이들 각각의 사전 확률은 2 % (1dp)이며 베이 즈 정리는 다음과 같이 알려줍니다.

P (PopMean = 66 주어진 데이터) = 8.2 % * 2 % / P (Data)

어디

P (데이터) = P (PopMean = 0 주어진 데이터) * 2 % + P (PopMean = 2 주어진 데이터) * 2 % + ... + P (PopMean = 100 주어진 데이터) * 2 %

이제 2 %를 취소 할 수 있으며 확률은 단순히 리샘플링 분포의 확률이므로 확률의 합은 1이어야합니다. 어느 결론은 우리에게

P (팝 평균 = 66) = 8.2 %

8.2 %는 66이 아니라 54에 대응하는 리샘플링 분포로부터의 확률이라는 것을 기억하고, 후방 분포는 단순히 샘플 평균 (60)에 대해 반영된 리샘플링 분포이다. 또한 리샘플링 분포가 비대칭이 임의라는 점에서 대칭 인 경우 (이 경우와 기타 여러 경우 에서처럼), 재 샘플 분포를 사후 확률 분포와 동일한 것으로 간주 할 수 있습니다.

이 주장은 다양한 가정을하는데, 주된 이유는 이전의 분포가 균일하다는 것입니다. 이것들은 위에서 인용 한 기사에서 더 자세하게 설명되어 있습니다.


Rubin에 의해 소개 된 베이지안 부트 스트랩과 같은 것이 있습니다. 그러나 나는 그것이 당신이 말하는 것이라고 생각하지 않습니다. Efron이 도입 한 일반적인 부트 스트랩은 실제로 자주 사용되는 개념입니다.
Michael Chernick
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.