오라클 불평등 : 기본적으로


14

오라클 불평등을 사용하여 무언가를 증명하는 논문을 겪고 있지만 그것이 무엇을하려고하는지조차 이해할 수 없습니다. 'Oracle Inequality'에 대해 온라인으로 검색했을 때 일부 소스는 "Candes, Emmanuel J. 'Oracle 불평등을 통한 현대의 통계적 추정"기사로 이동했습니다. " https://statweb.stanford.edu/~candes/papers/NonlinearEstimation.pdf 에서 찾을 수 있습니다 . 그러나이 책은 나에게 너무 무거워 보입니다. 전제 조건이 부족하다고 생각합니다.

제 질문은 : 오라클 불평등이 수학이 아닌 전공 (엔지니어 포함)에 대해 어떻게 설명하겠습니까? 두 번째로, 위에서 언급 한 책과 같은 것을 배우기 전에 전제 조건 / 주제를 다루도록 권장하는 방법은 무엇입니까?

구체적으로 파악하고 고차원 통계에 대한 경험이 많은 사람이 이에 대답해야합니다.


2
1k 이상의 평판을 가진 사람이라면 누구나이 질문에 현상금을 제공하십시오. 정말 도움이 될 것입니다. 대부분의 사용자는 통계 분석에 완전히 기반한 커뮤니티이기 때문에 이론적 인 분석이 아닌 데이터 분석에 통계를 사용하기 때문에 일반적인 CV 사용자는이 개념에 익숙하지 않을 것이라고 생각합니다. 질문이 충분히 관심을받지 못했다고 생각합니다.
울콧

1
나는 같은 질문에 대해 생각했다
jeza

링크의 p.22에 제공된 "정의"는 "오라클 불평등은 오라클이 제공 한 완벽한 정보에 의존하고 실제로는 이용할 수없는 이상적인 추정기의 성능과 실제 추정기의 성능과 관련이 있습니다." 이것이 당신에게 정의의 본질을 전달하지 않습니까?
Mark L. Stone

2
@Mark L. Stone 저에게는 그렇지 않습니다
jeza

1
앞의 몇 문장에서 제공된 예와 토론, 즉 오라클 4.1 불평등의 예로서 정리 4.1의 진술과 토론을 보더라도 말입니까? 평신도의 관점에서 : Gee, 우리는 우리가 사용해야 할 수축 계수의 최적 값 (오라클에 의해 제공됨)을 모릅니다. 그러나 수축 계수의 최적 값을 알면 오라클에서 최적의 수축 계수를 갖지 않는 것보다 2 이하로 MSE를 향상시킬 수 있습니다.
Mark L. Stone

답변:


8

선형 사례로 설명하려고합니다. 선형 모델 경우 (독립 변수의 개수가 적거나 후 관찰의 수와 동일) 및 디자인 매트릭스 풀 랭크를 가지며, 최소한의 자승 추정기 있다 및 예측 오류는 우리가 추론 할 수있는 이는 각 매개 변수 이 제곱 정확도 로 추정 됨을 의미합니다따라서 전체 제곱 정확도는

Yi=j=1pβjXi(j)+ϵi,i=1,...,n.
pnb
b^=(XTX)1XTY
X(b^β0)22σ2
EX(b^β0)22n=σ2np.
βj0σ2/n,j=1,...,p.(σ2/n)p.

관측치의 수가 독립 변수의 수 보다 작 으면 어떻게 될까요? 우리는 우리의 모든 독립 변수가 를 설명하는 역할을하는 것은 아니라고 믿습니다 . 따라서 소수만 이 0이 아닙니다. 어떤 변수가 0이 아닌지 알면 다른 모든 변수를 무시할 수 있으며 위의 인수로 전체 제곱 정확도는(p>n)Yk(σ2/n)k.

0이 아닌 변수 세트를 알 수 정규화 매개 변수 (변수 수를 제어 )와 함께 일부 정규화 페널티 (예 : ) 가 필요합니다 . 이제 위에서 설명한 것과 비슷한 결과를 얻으려면 제곱 정확도를 추정하려고합니다. 문제는 최적 추정량 이 (가) 이제 의존 입니다. 그러나 를 적절히 선택 하면 확률이 높은 예측 오차의 상한을 얻을 수 있다는 것입니다. 즉 "oracle 불평등" 추가 요인 참고l1λβ^λλ

X(β^β0)22nconst.σ2logpnk.
logp0이 아닌 변수 집합을 모르는 가격입니다. " "는 또는 에만 의존합니다 .const.pn

엄밀히 말하면, 모든 후속 부분이 정확하기 위해 관측치 수가 독립 변수 수보다 작을 필요는 없습니다.
jbowman

기대 방정식 (두 번째에서 마지막 방정식)과 불평등 (마지막 방정식)을 어떻게 얻었는지 설명 할 수 있습니까?
user13985

X(b^β0)22σ2 는 자유도가 p 인 카이 제곱 분포를 가지므로 기대 값은 입니다. 마지막 불평등은 오라클 불평등입니다. 증거가 그렇게 사소한 것은 아니므로이 책을 추천 할 수 있습니다. (σ2/n)p
고차원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.