Bayes Estimator는 선택 바이어스에 면역입니다


11

Bayes 추정기는 선택 바이어스에 면역성이 있습니까?

전체 게놈 서열 데이터와 같은 높은 차원의 추정에 대해 논의하는 대부분의 논문은 종종 선택 편향 문제를 제기합니다. 선택 편견은 수천 개의 잠재적 예측 변수가 있지만 선택되는 소수는 거의 없으며 선택된 소수에 대해서는 추론이 수행된다는 사실에서 비롯됩니다. 따라서 프로세스는 두 단계로 진행됩니다. (1) 예측 변수의 하위 집합 선택 (2) 예를 들어 추정 확률 비율과 같은 선택 세트에 대한 추론을 수행합니다. 그의 1994 년 역설 논문에서 Dawid는 편견없는 견적 자와 Bayes 견적에 초점을 맞추었다. 그는 치료 효과가 될 수있는 가장 큰 효과를 선택하는 문제를 단순화합니다. 그런 다음 편견없는 견적자는 선택 편견의 영향을받습니다. 그는 예제를 사용했다 : 하고 각각

ZiN(δi,1),i=1,,N
Zi 는 대해 편향되어 . 하자 , 추정기 (단 바이어스를 긍정적으로)에 대한 \ 최대 \ {\ delta_1, \ delta_2, \ ldots 단락, \ delta_N \} . 이 진술은 Jensen의 불평등으로 쉽게 입증 될 수 있습니다. 우리가 알고 있던 경우에 따라서, 내가 _ {\ 최대} , 최대의 인덱스 \ delta_i는 , 우리가 사용하는 Z_를 {내가 _ {\ 최대}} 공평의 추정으로. 그러나 우리는 이것을 알지 못하기 때문에 대신 \ gamma_1 (\ mathbf {Z})를 사용합니다 (긍정적으로).δiZ=(Z1,Z2,,ZN)T
γ1(Z)=max{Z1,Z2,,ZN}
max{δ1,δ2,,δN}imaxδiZimaxγ1(Z)

여기에 이미지 설명을 입력하십시오

그러나 Dawid, Efron 및 기타 저자들의 걱정스러운 진술은 Bayes 견적자가 선택 편견에 면역 적이라는 것입니다. 내가 지금 이전에 넣을 경우 말 , 다음의 베이 즈 추정 주어진다 여기서 이며 는 표준 가우스입니다.δiδig(.)δi

E{δiZi}=zi+ddzim(zi)
m(zi)=φ(ziδi)g(δi)dδiφ(.)

우리의 새로운 추정 정의하는 경우 로 어떤 당신이 추정하는 선택 와 는 동일한 것 선택의 기초가 된 경우 때문에 .This 아래와 단조에 . 우리는 또한 알고 shrinkes 용어로 0에 가까워,δimax

γ2(Z)=max{E{δ1Z1},E{δ2Z2},,E{δNZN}},
iδimaxγ1(Z)iγ2(Z)γ2(Z)ZiE{δiZi}Ziddzim(zi) 의 양의 바이어스를 입니다. 그러나 Bayes 추정기가 선택 편견에 면역 적이라고 어떻게 결론 내릴 수 있습니까? 나는 정말로 그것을 얻지 못한다.Zi

1
한 장의 문헌에서 주장을 언급하고 있다고 가정하면,이 주장의 전체 내용을 읽을 수 있도록 전체 상황과 페이지 참조를 제공 할 수 있습니까?
벤-복원 모니카

최대 견적을 Bayes 견적기로 정의하고 있습니까?
Xi'an

논문의 예제 1
Chamberlain Foncha

답변:


4

상술 한 바와 같이,이 문제는 정규 rvs 샘플의 가장 큰 평균의 지수 및 값 (i⁰, μ⁰)에 대한 추론을 유추한다. Dawid의 프레젠테이션에서 제가 놀랍게 생각하는 것은 베이지안 분석이 그다지 베이지안처럼 들리지 않는다는 것입니다. 전체 표본이 주어지면, 베이지안 접근법은 추정 i follow 추정에서 관련 평균 추정에 이르기까지 추정 단계를 따르는 것이 아니라 (i⁰, μ⁰)에 사후 분포를 생성해야합니다. 필요한 경우 추정자는 특정 손실 함수의 정의에서 나와야합니다. 대신 표본에서 가장 큰 점이 주어지고 그 점만 분포가 바뀌면 조정이 필요 없다는 진술에 상당히 기뻐합니다.

이전의 모델링은 또한 수단에 대한 우선 순위가 독립 법선의 산물이 아니라 결합되어야한다는 점에서 다소 놀랍습니다. 왜냐하면 이들 수단은 비교되고 비교 될 수 있기 때문입니다. 예를 들어 전체 데이터에서 위치와 규모를 추정 할 수있는 계층 적 우선 순위가 더 적절 해 보입니다. 평균 사이의 연결 만들기 ... 독립적으로 부적절한 선행을 사용하는 것에 대한 반대 의견은 최대 평균 μ⁰에 잘 정의 된 측정 값이 없다는 것입니다. 그러나 나는 일부 이전과 다른 것에 대한 비판이이 "역설"에 대한 적절한 공격이라고 생각하지 않는다.


1
알려지지 않은 모든 수단을 연결하기 위해 필요한 모든 보호 기능을 미리 코딩해야한다고 생각합니다. 이전의 방법이 수단들 사이에 큰 차이를 만들지 않는다면, 그것이 후부에 반영되어 완벽하게됩니다.
Frank Harrell

@ Xi'an 당신은 당신이 에 사전을 배치하는 방법의 예를 줄 수 있습니까? (i,μ)
Chamberlain Foncha

@Frank Harrel의 경우 및 . 의 편향 추정량 은 입니다. 의 Bayes 추정기 는 입니다. Bayes 추정기가 에서 모노톤이기 때문에 if 이 가장 큰 이므로 입니다. 이전의 정보가 아무리 유익해도 변경되지 않습니다. 단, 에서 양의 베이 즈 감소 . 그러나 잘못된 을 선택하면 Bayes 추정기가이를 수정할 수 없습니다.δiN(a,1)ZiN(δi,1)δiZiδiE(δi|Zi)Zi0ZiE(δi0|Zi0)ZiE(δi0|Zi0)Zi0i0
Chamberlain Foncha 2013 년

@ChamberlainFoncha : Bayes 추정기는 가 선험적으로 독립적 인 경우 에만 입니다. 와 앞에있는 관절 은 그것들을 실제로 의존하게 만듭니다. E[δi|Zi]δiiμi
시안

그리고 베이지안 관점에서 볼 때, 예를 들어, 인덱스에 대한 균일 한 분포와 에 대한 계층적인 사전이 허용됩니다 . μi
시안

1

약간 반 직관적이라하더라도 그 진술은 정확하다. 이 실험에서 가정 하면 의 후부 는 실제로 입니다. 이 반 직관적 사실은 Bayes가 (비밀) 조기 중지에 면역이되는 것과 약간 유사합니다 (이것은 또한 매우 직관적입니다).i=5μ5N(x5,σ2)

베이지안 추론은 그러한 각 실험에 대해 (몇 번 반복 반복한다고 상상하면) 가장 다양한 결과가 유지된다면 잘못된 결론으로 ​​이어질 것입니다. 데이터 선택이있을 것이며 베이지안 방법은 (비밀) 데이터 선택에 영향을 미치지 않습니다. 실제로 통계적 방법은 데이터 선택에 영향을 미치지 않습니다.

그러한 선택이 이루어진 경우,이 선택을 고려한 완전한 베이지안 추론은 착시를 쉽게 교정 할 수 있습니다.

그러나 "Bayes Estimator는 선택 바이어스에 면역입니다"라는 문장은 약간 위험합니다. "선택"이 설명 변수 선택 또는 데이터 선택과 같은 다른 것을 의미하는 상황을 쉽게 상상할 수 있습니다. 베이 즈는 이것에 대해 분명히 면역이되지 않습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.