모형이 사실이 아니더라도 MLE 추정이 무증상 적으로 정상적이고 효율적입니까?


13

전제 : 이것은 어리석은 질문 일 수 있습니다. MLE 점근 적 특성에 대한 진술 만 알고 있지만 증거를 연구 한 적이 없습니다. 내가했다면 아마도이 질문을하지 않을 수도 있고, 또는 나는이 질문이 이해가되지 않는다는 것을 깨달을 것입니다 ... 그래서 나에게 쉽게 가십시오 :)

나는 종종 모델 파라미터의 MLE 추정기가 무의식적으로 정상적이고 효율적이라는 진술을 보았습니다. 진술은 일반적으로 다음과 같이 작성됩니다

Nθ^dN(θ0,I(θ0)1)N

여기서 은 샘플 수이고 는 Fisher 정보이며 은 매개 변수 (벡터) true 값 입니다. 이제 실제 모델에 대한 참조가 있으므로 모델이 참이 아닌 경우 결과가 유지되지 않습니까?I θ 0NIθ0

예 : 풍속 와 가산 가우스 노이즈 의 함수로 풍력 터빈 전력 출력을 모델링한다고 가정 합니다.VPV

P=β0+β1V+β2V2+ϵ

적어도 두 가지 이유로 인해 모델이 잘못되었다는 것을 알고 있습니다 .1) 는 실제로 의 3 제곱에 비례 하고 2) 풍속과 관련이없는 다른 예측 변수를 무시했기 때문에 오류는 부가되지 않습니다 (나도 알고 있습니다) 것을 0이어야한다 0 풍속에) 힘은 생성되지 않습니다,하지만 여기에 관련이없는 때문에. 이제 풍력 터빈의 전력 및 풍속 데이터에 대한 무한 데이터베이스가 있다고 가정합니다. 원하는 크기의 샘플을 원하는만큼 그릴 수 있습니다. 크기가 각각 100 인 1000 개의 샘플을 그리고 \ boldsymbol {\ beta} = (\ beta_0, \ beta_1, \ beta_2) 의 MLE 추정치 인 \ hat {\ boldsymbol {\ beta}} _ {100}을 계산한다고 가정하겠습니다.V β 0PVβ0β^100β=(β0,β1,β2)(제 모델에서는 OLS 추정치입니다). 따라서 \ hat {\ boldsymbol {\ beta}} _ {100} 분포에서 1000 개의 표본이 있습니다 β^100. N = 500,1000,1500, \ dots로 운동을 반복 할 수 있습니다 N=500,1000,1500,. N 와 같이 , \ hat {\ boldsymbol {\ beta}} _ {N} 의 분포 β^N는 명시된 평균과 분산으로 무증상으로 나타나는 경향이 있습니까? 또는 모델이 잘못되었다는 사실이이 결과를 무효화합니까?

내가 묻는 이유는 응용 프로그램에서 모델이 "진정한"경우가 거의 없기 때문입니다. 모형이 사실이 아닐 때 MLE의 점근 적 특성이 상실되면, 다른 추정 원리를 사용하는 것이 합리적 일 수 있는데, 이는 모형이 올바른 설정에서는 덜 강력하지만 다른 경우에는 MLE보다 더 잘 수행 될 수 있습니다.

편집 : 의견에서 진정한 모델의 개념은 문제가 될 수 있다고 언급되었습니다. 내가 마음에 다음과 같은 정의를 가지고 : 모델의 가족 주어진 매개 변수 벡터에 의해 indicized , 가족의 각 모델에 대한 당신이 할 수 항상 쓰기 fθ(x)θ

Y=fθ(X)+ϵ

간단히 정의하여 으로 . 그러나 일반적으로 오류는 직교하지 않으며 평균 0을 가지며 모델의 파생에서 분포가 가정 된 것은 아닙니다. 값이 존재하면 있도록 이러한 두 가지 속성뿐만 아니라 가정 된 분포를, 나는 모델이 참 말할 것입니다. 나는 이것이 분해의 오류 항 때문에 라고 말하는 것과 직접 관련이 있다고 생각합니다.ϵYfθ(X)Xθ0ϵfθ0(X)=E[Y|X]

Y=E[Y|X]+ϵ

위에서 언급 한 두 가지 속성이 있습니다.


3
모델이 참이 아니더라도 MLE 추정은 종종 무증상 정상입니다. 예를 들어 "최소 거짓"매개 변수 값과 일치 할 수 있습니다. 그러나 그러한 경우에는 효능 또는 다른 최적 특성을 나타내는 것이 어렵다.
kjetil b halvorsen

1
효율성 전에 일관성을 살펴 봐야합니다. 진실이 검색 공간에없는 시나리오에서는 다음과 같이 일관성에 대한 다른 정의가 필요합니다. d (P *, P), 여기서 d는 발산 P *는 d 측면에서 가장 가까운 모델이고 P는 진실입니다. 예를 들어 d가 KL 발산 (MLE이 최소화하는 것) 인 경우 모델이 볼록하지 않으면 베이지안 절차가 일치하지 않는 것 (가장 가까운 모델에 도달 할 수 없음)이 알려져 있습니다. 따라서 MLE도 일관성이 없다고 가정합니다. 따라서 효율성이 잘못 정의됩니다. 홈페이지
.tudelft.nl / 19j49 / benelearn / papers / Paper_Grunwald.pdf

1
@Cagdas Ozgenc : 많은 경우 (예 : 로지스틱 회귀) MLE은 여전히 ​​"가장 잘못된"매개 변수와 일치합니다. 볼록하지 않은 경우의 불일치에 대한 귀하의 주장에 대한 언급이 있습니까? 매우 관심이 있습니까? (물류 회귀의 가능성 함수는 볼록합니다)
kjetil b halvorsen

@kjetilbhalvorsen homepages.cwi.nl/~pdg/ftp/inconsistency.pdf 머리 위로 다가 갔지만 이해하고 있습니다. 내 이해가 잘못된 경우 수정하십시오. 나는 결국 단지 취미입니다.
Cagdas Ozgenc

4
"모델이 참"또는 "거짓이 틀리다"와 같은 용어를 사용하면 문제가 발생합니다. 실제로 모델을 다룰 때 모델은 모두 근사치입니다. 특정 가정을하면 수학을 사용하여 통계적 속성을 표시 할 수 있습니다. 확률 수학과 실제 데이터 분석 간에는 항상 상충이 있습니다.
Michael R. Chernick

답변:


4

이 질문에 대한 답이 하나도 없다고 생각합니다.

최대 우도 추정을 적용하는 동안 가능한 분포 미스 팩션을 고려할 때 "Quasi-Maximum Likelihood"추정기 (QMLE)를 얻습니다. 어떤 경우에는 QMLE이 일관되고 무증상으로 정상입니다.

확실하게 잃는 것은 점근 효율입니다. 이 때문에의 점근 분산 (이 점근 분포 아니라 갖는 양이다 )이고, 모든 경우에,n(θ^θ)θ^

(1)Avar[n(θ^θ)]=plim([H^]1[S^S^T][H^]1)

여기서 는 로그 우도의 헤 시안 행렬이고 는 기울기이며 모자는 표본 추정치를 나타냅니다.HS

이제 우리가 정확한 사양 을 가지고 있다면 , 먼저

(2)Avar[n(θ^θ)]=(E[H0])1E[S0S0T](E[H0])1

여기서 " "아래 첨자는 실제 매개 변수에서의 평가를 나타내며 (중간 용어는 Fisher Information의 정의 임) 두 번째로 " 정보 매트릭스 평등 "은 는 점근 적 분산이 최종적으로0E[H0]=E[S0S0T]

(3)Avar[n(θ^θ)]=(E[H0])1

이는 Fisher 정보의 역수입니다.

그러나 우리는 misspecification, 표현이있는 경우 식으로 이어질하지 않습니다 (의 제 1 및 제 2 파생 상품 때문에 잘못된 가능성에 기초하여 유도 된)를. 이는 정보 매트릭스 불평등이 유지되지 않고 식 끝나지 않으며 (Q) MLE이 완전한 점근 효율을 달성하지 못한다는 것을 의미합니다.(1)(2)(1)(3)


Avar 는 랜덤 변수의 점근 적 분산이고 은 확률의 수렴을 나타냅니다. 귀하의 답변은 매우 흥미로운 것처럼 보이지만 귀하의 상황에서 가 무엇인지 이해하지 못합니다 . 나는 오른쪽 값 경우를 언급했다 단순히 존재하지 않습니다 값 어떤 경우 내 풍력 터빈의 예를 볼 더있다 항이 없고 와 관련된 다른 예측 변수가 없기 때문에 모형을 올바르게 만드는 값입니다 . 이 문맥에서 는 무엇을 의미합니까? plimθθβ=(β0,β1,β2)β3Vθ
델타 IV

죄송합니다, 제 코멘트의 첫 번째 판은 이해할 수 없었습니다 : 이제 나의 요점은 분명해야합니다. 다시 말해, "true" 가 없다면 , 표현식에서 로 무엇을 해석해야 합니까? θθn(θ^θ)
DeltaIV

1
@DeltaIV Zero. QMLE이 "캐치"합니까? 그것은 일관성이 있을지 아닌지에 달려 있습니다. 그리고 다시, 그 질문에 대한 답은 하나도 없습니다
Alecos Papadopoulos

1
이해했습니다. 따라서 QMLE (일관된 경우)은 수렴해야합니다. @kjetilbhalvorsen이 제안한대로 "최소한의 거짓"매개 변수 값으로 수렴한다고 생각했을 것입니다. QMLE과 작성한 방정식에 대한 참조를 제안 할 수 있습니까? 감사합니다θ=0
DeltaIV

1
@DeltaIV 나는 Hayashi ch. MLE 일관성, 정규성 등과 관련하여 Extremum Estimators에 관한 7 가지. QMLE과 관련하여 주제는 다소 광범위하다. 예를 들어, "QMLE"하에서 우리는 처음부터 우리가 추정하고있는 매개 변수가 "참 매개 변수"와 명확하게 연결되어 있지 않을 수도 있음을 인정하는 상황이있을 수 있습니다 (그러나 운동은 여전히 ​​근사치로 유효합니다). 제안 된대로 "최소 거짓"벡터를 구하십시오.
Alecos Papadopoulos
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.