MLE의 바이어스는 분산보다 어떤 모델에 더 빠릅니까?


14

θ^θnθ^θ 전형적 감소로서O(1/n). 삼각형의 불평등과 기대의 속성을 사용하면,이 오류 비율이 그 "편견"모두 의미 것을 보여주기 위해 가능Eθ^θ와 "편차"Eθ^θ^같은에서 감소O(1/n)요율. 물론 모델이 더 빠른 속도로 축소되는 바이어스를 가질 수 있습니다. 많은 모형 (예 : 최소 최소 제곱 회귀)은 편향이 없습니다.

나는 O ( 1 / √) 보다 빠르게 수축하는 바이어스를 가진 모델에 관심이 있습니다O(1/n)이지만 편차가 여전히O(1/ √) 로 줄어들 기 때문에 오류가이 빠른 속도로 줄어들지 않는 경우O(1/n). 특히, 모델의 바이어스가의 비율로 축소 될 수있는 충분한 조건을 알고 싶습니다O(1/n).


합니까 ? 또는? θ^θ=(θ^θ)2
Alecos Papadopoulos 2016

나는 구체적으로 L2 규범에 대해 묻고있었습니다. 그러나 질문에 더 쉽게 대답 할 수 있다면 다른 규범에도 관심이 있습니다.
Mike Izbicki 2016 년

O를 P ( 1 / N ) . (θ^θ)2Op(1/n)
Alecos Papadopoulos 2016

죄송합니다. 귀하의 의견을 잘못 읽었습니다. 차원 의 L2 표준의 경우 a b = d 이므로 수렴은O(1/ab=i=1d(aibi)2. 우리가 제곱하면O(1/n)로 수렴한다는 데 동의합니다. O(1/n)O(1/n)
Mike Izbicki 2016 년

능선 회귀 (Hoerl & Kennard 1970) 논문을 보셨습니까? 이것이 사실 일 것으로 예상되는 디자인 매트릭스 + 페널티에 대한 조건을 제공한다고 생각합니다.
dcl

답변:


5

일반적으로 MLE가 점진적으로 정상이 아닌 다른 분포로 수렴되는 모델이 필요합니다 (더 빠른 속도로 수행). 일반적으로 추정중인 모수가 모수 공간의 경계에있을 때 발생합니다. 직관적으로 이는 MLE가 "한 쪽에서 만"매개 변수에 접근하므로 매개 변수 주위를 "뒤로"이동하여 "분산되지"않기 때문에 "수렴 속도를 향상"시킵니다.

표준 예 는 U ( 0 , θ ) 균일 rv의 iid 샘플에서 에 대한 MLE입니다. 여기서 MLE는 최대 차수 통계입니다.θU(0,θ)

θ^n=u(n)

유한 표본 분포는

Fθ^n=(θ^n)nθn,fθ^=n(θ^n)n1θn

E(θ^n)=nn+1θB(θ^)=1n+1θ

따라서 . 그러나 분산에 대해서도 동일한 증가율이 유지됩니다.B(θ^n)=O(1/n)

하나는 또한 제한 분포를 얻기 위해 다음을 확인 할 수 있습니다, 우리는 변수 볼 필요가 (즉, 우리가에 의해 규모의 필요, N 이후)n(θθ^n)n

P[n(θθ^n)z]=1P[θ^nθ(z/n)]

=11θn(θ+zn)n=1θnθn(1+z/θn)n

1ez/θ

이는 지수 분포의 CDF입니다.

이것이 약간의 방향을 제시하기를 바랍니다.


점점 가까워 지지만 편차보다 편차가 더 빨리 줄어드는 상황에 특히 관심이 있습니다.
Mike Izbicki 2016 년

2
@MikeIzbicki Hmm ... 바이어스 수렴은 분포의 첫 번째 모멘트에 따라 달라지며 (의 제곱근) 분산도 "1 차"크기입니다. 나는 이것이 가능한 일인지 확신 할 수 없다. 왜냐하면 그것은 제한적인 분포의 순간들이 서로 호환되지 않는 수렴 속도로 "일어나"는 것을 암시하는 것처럼 보이기 때문이다. 그러나 나는 그것에 대해 생각할 것이다.
Alecos Papadopoulos 2016

2

내 다른 답변에 대한 의견 (및 OP 질문의 제목을 다시 살펴보십시오!)에 따르면,이 문제에 대한 이론적 탐구는 매우 엄격하지 않습니다.

우리는 결정하고자 여부 바이어스 분산의 제곱근과 다른 수렴 속도를 가질 수있다,B(θ^n)=E(θ^n)θ

B(θ^n)=O(1/nδ),Var(θ^n)=O(1/nγ),γδ???

우리는

B(θ^n)=O(1/nδ)limnδE(θ^n)<Klimn2δ[E(θ^n)]2<K

(1)[E(θ^n)]2=O(1/n2δ)

동안

Var(θ^n)=O(1/nγ)limnγE(θ^n2)[E(θ^n)]2<M

limn2γE(θ^n2)n2γ[E(θ^n)]2<M

(2)limn2γE(θ^n2)limn2γ[E(θ^n)]2<M

(2)

O(1/n2γ)γ=δ

B) 그러나 또한

(삼)2γ[이자형(θ^)]20[이자형(θ^)]2=영형(1/2γ)

()(1)

(4)2γ<2δδ>γ

따라서 원칙적으로 편차의 제곱근보다 더 빠른 속도로 바이어스를 수렴 할 수있는 것으로 보입니다. 그러나 편차의 제곱근이 바이어스보다 빠른 속도로 수렴 할 수는 없습니다.


(θ^)=0V아르 자형(θ^)=영형(1/)

(θ^)영형()

이자형θ^=θ(θ^)=이자형θ^θ=0=영형(1)=영형(1/0)

(θ^)=영형()(θ^)=영형(1/)

@MikeIzbicki 나는 여전히 "제로 바이어스"예제에 문제가 있다고 생각하지만 원칙적으로 바이어스가 더 빨리 수렴 할 수 있음을 보여주기 위해 내 대답을 수정했습니다.
Alecos Papadopoulos 2016 년
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.