베이지안 신뢰할 수있는 구간 절차에 대한 의사 결정 이론적 근거는 무엇입니까?


20

(내가 왜 이것을 썼는지 보려면 이 질문에 대한 내 답변 아래의 주석을 확인하십시오 .)

유형 III 오류 및 통계적 결정 이론

잘못된 질문에 대한 정답을 제공하는 것을 유형 III 오류라고도합니다. 통계적 의사 결정 이론은 불확실한 의사 결정의 공식화입니다. 유형 III 오류를 피할 수있는 개념적 프레임 워크를 제공합니다. 프레임 워크의 핵심 요소를 손실 함수 라고합니다 . 첫 번째는 (세계의 실제 상태 (예를 들어, 파라미터 추정 문제에서, 진정한 파라미터 값 )); 두 번째는 가능한 조치 세트의 요소입니다 (예 : 모수 추정 문제에서 추정치θ )θθ^). 출력은 가능한 모든 실제 세계 상태와 관련하여 가능한 모든 조치와 관련된 손실을 모델링합니다. 예를 들어, 파라미터 추정 문제에서 잘 알려진 손실 함수는 다음과 같습니다.

  • 절대 오차 손실L(θ,θ^)=|θθ^|
  • 제곱 오차 손실L(θ,θ^)=(θθ^)2
  • 할 바리 안의 LINEX 손실L(θ,θ^;k)=exp(k(θθ^))k(θθ^)1, k0

질문을 찾기 위해 답변을 검토

올바른 손실 함수를 공식화하고 나머지 의사 결정 이론적 접근법을 진행함으로써 유형 III 오류를 피할 수있는 경우가 있습니다 (여기에 자세히 설명되어 있지 않음). 그것은 내 요약이 아닙니다. 결국 통계 학자들은 그러한 접근 방식에서 파생되지 않았더라도 잘 작동하는 많은 기술과 방법을 잘 갖추고 있습니다. 그러나 최종 결과는 통계학 자의 대다수가 통계 결정 이론을 모르고 신경 쓰지 않는다는 것입니다. 이러한 통계 학자에게는 유형 III 오류를 피하는 데 통계적 결정 이론이 가치가 있다고 생각하는 이유는 제안 된 데이터 분석 절차를 요청할 수있는 프레임 워크를 제공하기 때문입니다.절차는 어떤 손실 함수 (있는 경우)에 최적으로 대처합니까? 즉, 어떤 의사 결정 상황에서 정확히 최고의 답변을 제공합니까?

사후 예상 손실

베이지안 관점에서, 손실 함수 만 있으면됩니다. 우리는 나머지 결정 이론을 거의 건너 뛸 수 있습니다. 거의 정의에 따르면, 최선의 방법은 사후 예상 손실 을 최소화 a 입니다. 즉 L~(a)=ΘL(θ,a)p(θ|D)dθ .

(베이지 아가 아닌 관점에 관해서는?) 잦은 결정 이론, 특히 Wald의 완전 계급 정리 이론일부에 대한 베이지안 후손 손실최소화 하는 최적의 행동 이 될 것입니다 (아마도 부적절한) 이 결과의 어려움은 그것이 사용되기 전에 어떤 이론에 대한 지침을 제시하지 않는 존재라는 이론이다. 그러나 그것은 우리가 어떤 질문인지 정확히 파악하기 위해 "반전"할 수있는 절차의 계급을 유익하게 제한한다. 특히, 비 베이지안 절차를 반전시키는 첫 단계는 어떤 베이지안 절차를 복제하거나 근사화 하는지를 알아내는 것입니다.

Cyan,이 사이트가 Q & A 사이트라는 것을 알고 있습니까?

마지막으로 통계적 질문으로 연결됩니다. 베이지안 통계에서, 일 변량 파라미터에 대한 구간 추정치를 제공 할 때, 두 가지 일반적인 신뢰할 수있는 구간 절차는 Quantile 기반의 신뢰할 수있는 구간과 가장 높은 후방 밀도의 신뢰할 수있는 구간입니다. 이 절차의 손실 기능은 무엇입니까?


아주 좋아요 그러나 이러한 절차를 정당화하는 유일한 손실 기능입니까?
손님

1
@Cyan >> 저에게 질문하고 대답 해 주셔서 감사합니다.
Stéphane Laurent

4
Berger의 통계 결정 이론과 베이지안 분석에 대한 흥미로운 인용문 : "우리는 신뢰할 수있는 세트가 명확한 의사 결정 이론적 역할을하는 것으로 간주하지 않으므로 신뢰할 수있는 세트를 선택하기위한 '최적 성'접근법에 대한 소문이 있습니다"
Simon Byrne

1
@Simon Byrne >> 1985는 오래 전입니다. 그가 아직도 그렇게 생각하는지 궁금합니다.
Cyan

1
@Cyan : 모르겠지만 의사 결정 이론은 지난 27 년 동안 크게 변하지 않은 베이지안 통계의 한 부분입니다 (몇 가지 흥미로운 결과는 있었지만 Berger의 책은 여전히 ​​표준 참조입니다). 인기 minimax와 비교할 때 잦은 통계가 발생합니다.
Simon Byrne

답변:


15

일 변량 구간 추정에서 가능한 조치 세트는 구간의 엔드 포인트를 지정하는 순서 쌍 세트입니다. 해당 집합의 요소를 로 나타내십시오 .(a,b), ab

가장 높은 후방 밀도 간격

사후 밀도를 둡니다 . 가장 높은 후방 밀도 간격은 실제 값을 포함하지 않는 간격에 불이익을주고 길이에 비례하여 간격에 불이익을주는 손실 함수에 해당합니다.f(θ)

,LHPD(θ,(a,b);k)=I(θ[a,b])+k(ba),0<kmaxθf(θ)

여기서 표시기 기능 입니다. 이것은 예상되는 후방 손실을 제공합니다I()

L~HPD((a,b);k)=1Pr(aθb|D)+k(ba) .

설정 A의 산출에 필요한 조건 매개 변수 공간 내부에서 국소 최적 : – 예상 한대로 HPD 간격에 대한 규칙.f(a)=f(b)=kaL~HPD=bL~HPD=0f(a)=f(b)=k

형태 HPD 간격 단조 증가 변환에 불변되지 않는 이유에 대한 통찰력 제공 파라미터를. - 공간 HPD 간격으로 변화 공간이 상이한 - 공간 HPD 간격 개의 간격이 다른 손실 함수에 대응하기 때문에 다음 - 공간 HPD 간격에 대응하는 변형 된 길이 패널티 .g(θ)θg(θ)g(θ)g(θ)k(g(b)g(a))L~HPD((a,b);k)g(θ)θg(θ)g(θ)g(θ)k(g(b)g(a))

Quantile 기반의 신뢰할 수있는 간격

손실 함수로 점 추정을 고려하십시오

Lq(θ,θ^;p)=p(θ^θ)I(θ<θ^)+(1p)(θθ^)I(θθ^), 0p1 입니다.

사후 예상 손실은

L~q(θ^;p)=p(θ^E(θ|θ<θ^,D))+(1p)(E(θ|θθ^,D)θ^) .

설정 수율 암시 방정식ddθ^L~q=0

Pr(θ<θ^|D)=p ,

즉, 최적의 는 예상대로 사후 분포 의 % 분위수입니다. (100(P))θ^(100p)

따라서 Quantile 기반 구간 추정값을 얻기 위해 손실 함수는 다음과 같습니다.

LqCI(θ,(a,b);pL,pU)=Lq(θ,a;pL)+Lq(θ,b;pU) .


1
이를 동기 부여하는 또 다른 방법은 손실 함수를 간격의 너비 + 간격이 true 를 덮지 못하는 거리 (있는 경우)의 (가중) 합계로 다시 작성하는 것 입니다. θ
손님

Quantile 또는 간격의 길이를 직접 참조하지 않는 Quantile 기반 간격을 생각할 수있는 다른 방법이 있습니까? 나는 "분위 간격이 평균 / 최소 / 최대 / 등 무언가 측정을 최대화 / 최소화하는 것"과 같은 것을 기대하고 있었다
Rasmus Bååth

@ RasmusBååth, 기본적으로, "사후 예상 손실을 최소화하기위한 Quantile 간격의 손실 함수에 필요한 조건은 무엇입니까?" 수학이 정방향으로 작동하는 방식으로부터의 직관은 이것이 거의 사실이라는 것입니다. 그러나 그것을 증명하지 못했습니다.
Cyan

따라서 손실 함수에 대해 잘 모르겠지만 점 손실 함수 에 따라 HPD 또는 Quantile 간격이 발생 하는 절차를 알고 있습니다. 당신이 무작위 샘플이 가정 후방에서 무승부를. 1. 사후 손실이 가장 낮은 지점을 선택하고 해당 지점을 구간에 추가합니다. 관점에서 것을 2. 제거 인해 제거에가, 나머지 점에 대한 사후 손실 지금 변화 (에 따라 수도 ). 3. 구간에 필요한 적용 범위가 있는지 확인하고, 그렇지 않으면 (1)부터 반복하십시오. L = L0은 HPD를 제공하고 L = L1은 Quantile 간격을 제공합니다. LLssssL
Rasmus Bååth

5
Bayesian Choice의 5.5.3 절 은 믿을만한 세트의 손실 기반 파생을 다루고 있다고 언급했습니다 .
Xi'an

1

최소 크기의 간격

구간 선택에 대한 손실 함수 (베이지안 및 빈번한)의 분명한 선택은 한계 분포 측면에서 측정 된 구간의 크기를 사용하는 것입니다. 따라서 원하는 특성 또는 손실 함수로 시작하여 최적의 간격을 도출하십시오. 이것은 가능하지만, 본 질문에 의해 예시 된 바와 같이, 수행되지 않는 경향이있다. 베이지안 신뢰할 수있는 세트의 경우, 이는 간격의 사전 확률을 최소화하거나 예를 들어 Evans (2016)에 요약 된대로 상대적 신념을 최대화하는 데 해당합니다. 이 크기는 또한 잦은 신뢰 설정을 선택하는 데 사용될 수 있습니다 (Schafer 2009). 두 가지 접근 방식은 서로 관련이 있으며, 큰 상호 정보가 포함 된 결정을 우선적으로 포함하는 결정 규칙을 통해 상당히 쉽게 구현할 수 있습니다 (Bartels 2017).

Bartels, C., 2017. 잦은 테스트에서 사전 지식 사용. 무화과. https://doi.org/10.6084/m9.figshare.4819597.v3

Evans, M., 2016. 상대적 신념을 사용하여 통계적 증거 측정. 전산 및 구조 생명 공학 저널, 14, pp.91-96.

Schafer, CM 및 Stark, PB, 2009. 최적의 예상 크기의 신뢰 영역을 구성합니다. 미국 통계 협회 저널, 104 (487), pp.1080-1089.


Keith O'Rourke의 제안 ( andrewgelman.com/2016/07/17/… )에 따라 Evans를 인용하고 있습니다. 에반스의 물건을 정말 좋아합니다.
Cyan

Keith가 다르게 시작하는 작업에 대해 알게 된 것을 매우 기쁘게 생각하지만 비슷한 결론으로 ​​끝납니다! 이것을 인용하는 것이 중요합니다.
user36160
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.