베이지안 통계가 잦은 방법을 통해 추정하기 어려운 매개 변수를 추정하는 방법의 예


9

베이지안 통계학자는 "베이지 통계는 빈번한 방법을 통해 추정하기 매우 어려운 매개 변수를 추정 할 수있다"고 주장합니다. 이 SAS 문서 에서 인용 한 다음 인용문도 같은 내용 입니까?

그것은 데이터에 조건 적이며 점근 적 근사에 의존하지 않고 정확한 추론을 제공합니다. 작은 샘플 추론은 큰 샘플을 가진 것과 같은 방식으로 진행됩니다. 베이지안 분석은 또한 "플러그인"방법 (기능에서 추정 된 매개 변수를 연결하여 기능을 추정하는 방법)을 사용하지 않고 매개 변수의 기능을 직접 추정 할 수 있습니다.

나는 일부 교과서에서 비슷한 진술을 보았지만 어디에 있는지 기억하지 못합니다. 누구든지 예를 들어 설명해 주시겠습니까?


내일 해가 올 확률은 얼마입니까? en.wikipedia.org/wiki/Sunrise_problem 이 예는 당신이 기대했던 것보다 더 사소한 것일 수 있습니다
Hugh

질문에 직접 인용문을 넣을 수 있습니까? 제목은 두 번째 글 머리표와 관련이없는 것 같습니다.
Hugh

1
이 인용문의 진술은 (a) "정확한"은 거기에 아무런 의미가 없으며 (b) 플러그인 비판은 다른 추정치가 아닌 전체 후부를 고려할 때만 적용되며 선택한 손실 함수에 따라 적용됩니다. 추정. 일부 답변이 다른 질문을 참조하십시오 .
시안

답변:


8

나는 그 인용에 반대합니다.

  1. "Frequentism"은 선택된 추정기의 주파수 특성을 기반으로하는 추론에 대한 접근 방식입니다. 이는 추정자가 수렴해야한다는 것과 심지어 수렴해야하는 방식으로 수행해야한다고 명시하지 않은 모호한 개념입니다. 예를 들어, 편견은 빈번한 개념이지만 매개 변수의 모든 기능을 유지할 수는 없습니다.θ] 변형의 수집 이후 관심 θ편견없는 견적을 허용하는 것은 매우 제한적입니다. 또한, 빈번한 견적은 패러다임에 의해 생성되지 않지만 평가되기 전에 먼저 선택되어야합니다. 그런 의미에서 베이지안 추정기는 잦은 재산을 충족시키는 경우 잦은 추정자입니다.
  2. 베이지안 접근법에 의해 생성 된 추론은 밀도에 의해 표현 된 사후 분포를 기반으로합니다. π(θ|D). "정확한"이라는 용어가 어떻게 첨부되는지 이해할 수 없습니다π(θ|D). 그것은 이전 배포와 고유하게 연관되어 있습니다.π(θ)그것은 정확히 베이 즈 정리에 의해 도출됩니다. 그러나 점 추정치가 모수 의 실제 값 이 아니라는 정확한 추론을 반환하지는 않습니다.θ그리고 이전 x 우도 쌍에 의해 제공된 프레임 워크 내에서만 정확한 확률 진술을 생성한다 . 쌍에서 하나의 용어를 변경하면 사후와 유추가 수정되지만 단일 이전 또는 가능성 을 방어하는 일반적인 주장은 없습니다 .
  3. 마찬가지로, 이 SAS 문서 의 동일한 페이지에있는 "실제 모수는 0.95의 95 % 신뢰할 수있는 간격으로 떨어질 확률이 0.95"와 같은 다른 확률 설명 은 사후 분포의 프레임 워크와 관련이 있지만 절대 값은 아닙니다.
  4. 계산적 관점에서 베이지안 접근 방식이 표준 고전적 접근 방식이 실패하는 경우 종종 정확한 답이나 대략적인 답을 반환 할 수 있습니다. 예를 들어 잠재 된 (또는 누락 된) 가변 모델의 경우
    f(x|θ)=g(x,z|θ)dz
    어디 g(x,z|θ) 쌍의 관절 밀도 (X,Z) 어디서 Z 관찰되지 않음 θ 그리고 쌍의 시뮬레이션에 의한 후부의 (θ,Z)최대 가능성 추정기 (proquentist?) 견적을 도출하는 것보다 훨씬 더 쉬운 방법 일 수 있습니다. 이 설정의 실제 예는 인구 유전학에서 Kingman의 유착 모델이며 , 공통 조상으로부터의 인구 진화에는 이진 트리에서의 잠재 사건이 포함됩니다. 이 모델은 베이시스 이외의 소프트웨어 해상도 도 있지만 ABC라고하는 알고리즘을 통해 [대략] 베이지안 추론으로 처리 할 수 ​​있습니다 .
  5. 그러나 그러한 경우에도 베이지안 유추가 유일한 해결책 이라고 생각하지 않습니다 . 신경망, 랜덤 포레스트, 딥 러닝과 같은 머신 러닝 기법은 교차 검증으로 샘플을 학습하여 기대치로 볼 수있는 오류 또는 거리 기준을 최소화하므로 잦은 방법으로 분류 할 수 있습니다 [실제 모델에서] 표본 평균에 의해 추정됩니다. 예를 들어, Kingman의 유착 모델은 베이 아 이외의 소프트웨어 해상도로 도 처리 할 수 ​​있습니다 .
  6. 마지막 포인트는 포인트 추정을 위해 베이지안 접근 방식이 플러그인 추정을 잘 생성 할 수 있다는 것입니다. 내가 본질적 손실 이라고하는 일부 손실 함수의 경우, 베이 즈 추정기h(θ) 변형이다 h(θ^) 베이 즈 추정기의 θ.

대답은 끝까지 좋습니다. ML 방법이 이론에 의해 아직 정당화되지 않은 우수한 성능이기 때문에 포인트 5를 반대합니다. 또한 "... 진정한 모델 ..."은 무엇을 의미합니까? 의심 할 여지없이, 이러한 방법은 널리 사용되지만 일반적으로 "확장 할 수있는"능력에 의해 인기가 입증됩니다. 불행히도, 비 ML 베이지안 및 빈번한 방법으로 제공되는 많은 진단 통찰력은 그러한 접근 방식을 사용할 때 손실됩니다. 특히, 교차 검증은 다른 기술보다 더 높은 오류율을 산출 할 수 있습니다 (Efron, 1983, 1986, JASA 참조).
Jan Galkowski

감사. 실제로, 나는 "우수한"힘을 가진 ML 방법을 부여하지 않고, 복잡한 모델에 대해 일부 ML 답변이 제안 될 수 있다고 언급한다. 그리고 "진정한 모델"은 데이터가 해당 모델에 의해 생성되었다고 가정하는 방법의 성능에 대한 평가를 의미합니다. 이것은 대부분의 통계 분석 imo의 결함입니다.
Xi'an
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.