관심이 단순히 모델의 매개 변수 (포인트 및 / 또는 간격 추정)를 추정하고 사전 정보가 신뢰할 수없고 약하지 않은 경우 (이는 약간 모호하지만 알고있는 시나리오를 설정하려고합니다. 이전이 어렵다) ... 왜 누군가가 전통적인 접근 방식 대신 '비 정보 적'부적절한 선행과 함께 베이지안 접근 방식을 사용하려고합니까?
관심이 단순히 모델의 매개 변수 (포인트 및 / 또는 간격 추정)를 추정하고 사전 정보가 신뢰할 수없고 약하지 않은 경우 (이는 약간 모호하지만 알고있는 시나리오를 설정하려고합니다. 이전이 어렵다) ... 왜 누군가가 전통적인 접근 방식 대신 '비 정보 적'부적절한 선행과 함께 베이지안 접근 방식을 사용하려고합니까?
답변:
정보가 부족한 사전 정보를 사용하는 경우에도 베이지안 접근 방식을 사용하는 두 가지 이유는 다음과 같습니다.
결과는 매우 비슷하지만 해석은 다릅니다.
신뢰 구간은 실험을 여러 번 반복하고 실제 매개 변수를 95 % 캡처 할 수 있다는 개념을 의미합니다. 그러나 95 %의 확률 로 캡처 할 수는 없습니다 .
반면에 신뢰할 수있는 구간 (Bayesian)에서는 구간이 실제 값을 캡처하는 95 % "기회"가 있다고 말할 수 있습니다. 업데이트 : 베이지안을 더 많이 넣는 방법은 결과에 대해 95 % 확신 할 수 있다는 것입니다.
이것은 당신이에서 갔다해서입니다 에 P ( H의 Y의 P O t H 전자 의 난 의 | D t ) Baye의 규칙을 사용하여.
그렇게하는 한 가지 이유는 베이지안 분석이 전체 사후 분포를 제공하기 때문입니다. 이는 일반적인 잦은 보다 더 자세한 간격을 초래할 수 있습니다 . Reis and Stedinger 2005의 해당 인용문은 다음과 같습니다.
모수의 전체 사후 분포를 제공하는 것은 고전적인 방법에 비해 베이지안 접근법의 장점입니다. 일반적으로 우도 함수 모드로 표현되는 모수의 점 추정치 만 제공하고 점근 적 정규성 가정과 2 차 근사를 사용합니다. 불확실성을 설명하는 로그 우도 함수의 Bayesian 프레임 워크를 사용하면 모수의 전체 후방 분포를 사용할 수 있으므로 불확실성을 평가하기 위해 근사값을 사용할 필요가 없습니다. 또한 베이지안 분석은 고전 통계의 신뢰 구간 개념보다 더 쉽게 해석 할 수있는 매개 변수 또는 매개 변수의 기능에 대한 신뢰할 수있는 구간을 제공 할 수 있습니다 (Congdon, 2001).
예를 들어 두 매개 변수의 차이에 대한 신뢰할 수있는 간격을 계산할 수 있습니다.
Harold Jeffreys 경은 베이지안 접근법의 강력한 지지자였습니다. 그는 만약 당신이 확산 부적절한 사전을 사용한다면 결과 베이지안 추론이 잦은 추론 적 접근과 동일 할 것임을 보여 주었다 (즉, 베이지안 신뢰할만한 영역은 잦은 신뢰 구간과 동일하다). 대부분의 베이지안은 적절한 정보 이전을 옹호합니다. 부적절한 선행에 문제가 있으며 어떤 것은 어떤 사전도 진정으로 비 정보 적이 지 않다고 주장 할 수 있습니다. 이 Jeffreys의 사전을 사용하는 베이지안은 Jeffreys의 추종자로 그것을 수행한다고 생각합니다. 베이지안 접근법의 가장 강력한 지지자 중 하나 인 Dennis Lindley 는 Jeffreys에 대해 많은 존경을 받았지만 유익한 정보 이전을지지했습니다.
베이지안 접근 방식에는 실질적인 이점이 있습니다. 그것은 종종 의무적 인 평가에 도움이됩니다. 또한 새로운 모델 패밀리를 가능하게하고보다 복잡한 (계층 적, 다중 레벨) 모델을 구성하는 데 도움이됩니다.
예를 들어, 혼합 모수 (분산 모수를 갖는 랜덤 효과 포함)를 사용하면 하위 수준 모수 (모델 계수;이를 REML ) 에 대해 주 변화하여 분산 모수를 추정하면 더 나은 추정치를 얻을 수 있습니다. 베이지안 접근 방식은 자연스럽게이 작업을 수행합니다. 이러한 모델을 사용하면 REML을 사용하더라도 분산 모수의 최대 가능성 (ML) 추정치는 종종 0이거나 하향 편향됩니다. 분산 매개 변수에 대한 적절한 선행이 도움이됩니다.
점 추정 ( MAP , 최대 사후)을 사용 하더라도 사전에 모델 군을 변경합니다. 다소 공 선형 변수가 많은 선형 회귀 분석은 불안정합니다. L2 정규화는 치료법으로 사용되지만, 가우시안 (비 정보) 및 MAP 추정을 가진 베이지안 모델로 해석 할 수 있습니다. (L1 정규화는 다른 이전과 다른 결과를 제공합니다. 실제로 여기서 이전은 다소 유익 할 수 있지만 단일 매개 변수가 아니라 매개 변수의 집단적 특성에 관한 것입니다.)
따라서 베이지안 접근법이 필요한 작업을 수행하는 데 일반적이고 비교적 간단한 모델이 있습니다!
머신 러닝에 사용되는 잠재적 인 Dirichlet Allocation (LDA) 과 같은보다 복잡한 모델이 더 유리 합니다. 그리고 일부 모델은 기본적으로 베이지안 프로세스 입니다 ( 예 : Dirichlet 프로세스 기반 모델) .
몇 가지 이유가 있습니다.
정보가없는 사전을 사용하는 것의 단점은, 가장 중요하다고 생각하는 것부터 시작하여 매우 중요한 기술적 인 측면을 향하고 있습니다.
마지막 요점은 적절한 후부를 보장하기 위해 다소 모호한 (또는 약간 더 약한 정보) 사전을 선호한다는 주장입니다. 물론, 이것들로부터 표본을 추출하는 것은 때때로 어려울 수 있으며, 전체 후방이 탐색되지 않았다는 것을 알아 차리지 못할 수도 있습니다. 그러나, 모호한 (그러나 적절한) 사전을 가진 베이지안 방법은 잦은 관점에서 볼 때 아주 좋은 샘플 특성을 갖는 것으로 나타 났으며, 더 많은 데이터가있는 경우에는 거의 사용하지 않을 것입니다. 정보가없는 사전 방법과의 차이점.