Bayes 추정기는 선택 바이어스에 면역성이 있습니까?
전체 게놈 서열 데이터와 같은 높은 차원의 추정에 대해 논의하는 대부분의 논문은 종종 선택 편향 문제를 제기합니다. 선택 편견은 수천 개의 잠재적 예측 변수가 있지만 선택되는 소수는 거의 없으며 선택된 소수에 대해서는 추론이 수행된다는 사실에서 비롯됩니다. 따라서 프로세스는 두 단계로 진행됩니다. (1) 예측 변수의 하위 집합 선택 (2) 예를 들어 추정 확률 비율과 같은 선택 세트에 대한 추론을 수행합니다. 그의 1994 년 역설 논문에서 Dawid는 편견없는 견적 자와 Bayes 견적에 초점을 맞추었다. 그는 치료 효과가 될 수있는 가장 큰 효과를 선택하는 문제를 단순화합니다. 그런 다음 편견없는 견적자는 선택 편견의 영향을받습니다. 그는 예제를 사용했다 :
하고 각각
Zi∼N(δi,1),i=1,…,N
Zi 는 대해 편향되어 . 하자 , 추정기
(단 바이어스를 긍정적으로)에 대한
\ 최대 \ {\ delta_1, \ delta_2, \ ldots 단락, \ delta_N \} . 이 진술은 Jensen의 불평등으로 쉽게 입증 될 수 있습니다. 우리가 알고 있던 경우에 따라서,
내가 _ {\ 최대} , 최대의 인덱스
\ delta_i는 , 우리가 사용하는
Z_를 {내가 _ {\ 최대}} 공평의 추정으로. 그러나 우리는 이것을 알지 못하기 때문에 대신
\ gamma_1 (\ mathbf {Z})를 사용합니다 (긍정적으로).
δiZ=(Z1,Z2,…,ZN)Tγ1(Z)=max{Z1,Z2,…,ZN}
max{δ1,δ2,…,δN}imaxδiZimaxγ1(Z)
그러나 Dawid, Efron 및 기타 저자들의 걱정스러운 진술은 Bayes 견적자가 선택 편견에 면역 적이라는 것입니다. 내가 지금 이전에 넣을 경우 말 , 다음의 베이 즈 추정 주어진다
여기서 이며 는 표준 가우스입니다.δiδi∼g(.)δi
E{δi∣Zi}=zi+ddzim(zi)
m(zi)=∫φ(zi−δi)g(δi)dδiφ(.)
우리의 새로운 추정 정의하는 경우 로
어떤 당신이 추정하는 선택 와 는 동일한 것 선택의 기초가 된 경우
때문에 .This 아래와 단조에 . 우리는 또한 알고 shrinkes 용어로 0에 가까워,δimax
γ2(Z)=max{E{δ1∣Z1},E{δ2∣Z2},…,E{δN∣ZN}},
iδimaxγ1(Z)iγ2(Z)γ2(Z)ZiE{δi∣Zi}Ziddzim(zi) 의 양의 바이어스를 입니다. 그러나 Bayes 추정기가 선택 편견에 면역 적이라고 어떻게 결론 내릴 수 있습니까? 나는 정말로 그것을 얻지 못한다.
Zi