모수 추정에 관한 문제


13

하자 및 것을 네 랜덤 변수하여야 . 여기서 은 알 수없는 매개 변수입니다. 또한 , 라고 가정하십시오그렇다면 어느 것이 사실입니까?Y1,Y2,Y3Y4E(Y1)=θ1θ3;  E(Y2)=θ1+θ2θ3;  E(Y3)=θ1θ3;  E(Y4)=θ1θ2θ3 V a r ( Y i ) = σ 2 i = 1 , 2 , 3 , 4.θ1,θ2,θ3Var(Yi)=σ2i=1,2,3,4.

A. 는 추정 가능합니다.θ1,θ2,θ3

B. 는 추정 가능합니다.θ1+θ3

C. 은 추정 가능하며 은 의 가장 선형적인 편향 추정치입니다 .1θ1θ312(Y1+Y3)θ1θ3

D. 는 추정 가능합니다.θ2

대답은 C로 나에게 이상해 보입니다 (D를 얻었 기 때문에).

왜 D를 얻었습니까? 이후 입니다.E(Y2Y4)=2θ2

C가 답이 될 수 있음을 이해하지 못하는 이유는 무엇입니까? . 는 의 편견 추정치이며 분산은 보다 작습니다 .Y1+Y2+Y3+Y44θ1θ3Y1+Y32

내가 잘못하고있는 곳을 알려주세요.

또한 여기에 게시 : /math/2568894/a-problem-on-estimability-of-parameters


1
self-study태그를 넣으면 누군가가 와서 질문을 닫을 것입니다.
Carl

@Carl 끝났는데 왜?
Stat_prob_001

그들은의 규칙 사이트에 대한, 나의 규칙, 사이트 규칙을.
Carl

가 ? Y1Y3
Carl

1
@Carl 당신은 이런 식으로 생각할 수 있습니다 : 여기서 은 평균이 이고 분산이 rv입니다 . 그리고 여기서 평균이 인 RV 이고 분산ε 1 0 σ 2 Y 3 = θ 1 - θ 3 + ε 3 ε 3 0 σ 2Y1=θ1θ3+ϵ1ϵ10σ2Y3=θ1θ3+ϵ3ϵ30σ2
Stat_prob_001

답변:


8

이 답변은 추정 가능성의 검증을 강조합니다. 최소 분산 특성은 2 차 고려 사항입니다.

먼저 선형 모델의 행렬 형식으로 정보를 다음과 같이 요약하십시오. 여기서 (추정 성을 논의하기 위해 순도 가정은 필요하지 않지만 Gauss-Markov 속성에 대해서는 의 spherity를 ​​가정해야합니다 ). E(

(1)Y:=[Y1Y2Y3Y4]=[101111101111][θ1θ2θ3]+[ε1ε2ε3ε4]:=Xβ+ε,
εE(ε)=0,Var(ε)=σ2Iε

설계 행렬 가 전체 순위 인 경우 원래 매개 변수 는 고유 최소 제곱 추정값 합니다. 따라서, 어떠한 파라미터 선형 함수로 정의 의 가 명확 최소 제곱 통해 데이터가 추정 될 수 있다는 의미있게 추정은 추정 로 입니다.β β = ( X ' X ) - 1 X ' Y φ φ ( β ) β β φ = P ' βXββ^=(XX)1XYϕϕ(β)ββ^ϕ^=pβ^

가 전체 순위가 아닌 경우 미묘함이 발생합니다 . 철저한 논의를 위해 아래에서 먼저 몇 가지 표기법과 용어를 수정합니다 (저는 선형 모델대한 좌표없는 접근 , 섹션 4.8. 일부 용어는 불필요하게 기술적으로 들립니다). 또한, 논의는 및 일반 선형 모델 됩니다 .Y = X β + ε X R n × k β R kXY=Xβ+εXRn×kβRk

  1. 회귀 매니 폴드 로 평균 벡터의 집합이다 따라 변하는 : R k M = { X β : β R k } .βRk
    M={Xβ:βRk}.
  2. 파라 기능 의 선형 작동 , β ϕ ( β ) = p ' β = p 1 β 1 + + p k β k .ϕ=ϕ(β)β
    ϕ(β)=pβ=p1β1++pkβk.

위에서 언급했듯이 인 경우 모든 매개 변수 기능 를 추정 할 수있는 것은 아닙니다 . 그러나 기술적으로 예측 가능한 용어의 정의는 무엇 입니까? 작은 선형 대수를 방해하지 않고 명확한 정의를 제공하는 것은 어려운 것 같습니다. 내가 가장 직관적이라고 생각하는 한 가지 정의는 다음과 같습니다 (위에서 언급 한 것과 동일한 참조).ϕ ( β )rank(X)<kϕ(β)

정의 1. 파라 메트릭 함수는때마다라는 의미에서에의해 고유하게 결정되면 추정 할 수 있습니다.는만족.X β ϕ ( β 1 ) = ϕ ( β 2 ) β 1 , β 2R k X β 1 = X β 2ϕ(β)Xβϕ(β1)=ϕ(β2)β1,β2RkXβ1=Xβ2

해석. 위의 정의는 회귀 매니 폴드 에서 의 매개 변수 공간으로 의 맵핑은 일대일이어야한다고 명시하고 있으며 이는 일 때 (즉, 자체가 1 일 때) 일대일). 때 , 우리는 거기에 존재한다는 것을 알고 등이 . 위의 추정 가능한 정의는 사실상 구조적 결함이있는 파라 메트릭 기능을 배제하여 과 동일한 값으로도 서로 다른 값을 가져 오는 것은 자연스럽지 않습니다. 반면에 추정 가능한 매개 변수 기능ϕ 순위 ( X ) = k X 랭크 ( X ) < k β 1β 2 X β 1 = X β 2 M ϕ ( ) ϕ ( β 1 ) = ϕ ( β 2 ) β 1β 2 X β 1 = X β 2Mϕrank(X)=kXrank(X)<kβ1β2Xβ1=Xβ2Mϕ()허용 않는 경우 와 , 한 상태로서 실현된다.ϕ(β1)=ϕ(β2)β1β2Xβ1=Xβ2

동일한 참조 인 발의안 8.4에 나와있는 파라 메트릭 기능의 추정 가능성을 확인하기위한 다른 동등한 조건이 있습니다.

그런 장황한 배경을 소개 한 후에 다시 질문으로 돌아 갑시다.

A. 자체는 이므로 와 함께 가 포함 . 위의 정의는 스칼라 함수에 대해 제공되지만 벡터 값 함수로 쉽게 일반화됩니다.순위 ( X ) < 3 X β 1 = X β 2 β 1β 2βrank(X)<3Xβ1=Xβ2β1β2

B. 는 추정 할 수 없습니다. 다시 , 및 을 고려하면 이지만 입니다.β 1 = ( 0 , 1 , 0 ) β 2 = ( 1 , 1 , 1 ) X β 1 = X β 2 ϕ 1 ( β 1 ) = 0 + 0 =ϕ1(β)=θ1+θ3=(1,0,1)ββ1=(0,1,0)β2=(1,1,1)Xβ1=Xβ2ϕ1(β1)=0+0=0ϕ1(β2)=1+1=2

C. 는 추정 가능합니다. 이 때문에 사소 의미 , 즉 입니다.X β 1 = X β 2 θ ( 1 ) 1θ ( 1 ) 3 = θ ( 2 ) 1θ ( 2 ) 3 ϕ 2 ( β 1 ) = ϕ 2ϕ2(β)=θ1θ3=(1,0,1)βXβ1=Xβ2θ1(1)θ3(1)=θ1(2)θ3(2)ϕ2(β1)=ϕ2(β2)

D. 인 도 어림 . 으로부터 유도 에 또한 간단하다.X β 1 = X β 2 ϕ 3 ( β 1 ) = ϕ 3 ( β 2 )ϕ3(β)=θ2=(0,1,0)βXβ1=Xβ2ϕ3(β1)=ϕ3(β2)

추정 가능성이 확인 된 후 의 가우스-마코프 속성에 대한 정리 (제안 8.16, 동일한 참조)가 있다고 주장합니다 . 해당 정리에 따라 옵션 C의 두 번째 부분이 올바르지 않습니다. 가장 좋은 선형 편향 추정값은 아래 정리에 따라 입니다.ˉ Y = ( Y 1 + Y 2 + Y 3 + Y 4 ) / 4ϕ(β)Y¯=(Y1+Y2+Y3+Y4)/4

정리. 하자될 어림 파라 작용하고 최선 바이어스 추정 선형 (일명, 가우스 - 마르코프 추정치)이다어떤 솔루션를 정규 방정식.φ ( β ) β X ' X β = X ' Yϕ(β)=pβϕ(β^)β^XXβ^=XY

증거는 다음과 같습니다.

증명. 간단한 계산은 정규 방정식이 임을 보여줍니다. , 단순화 후 즉 입니다. [ φ ( β ) θ (2) / 2 - φ ( β ) ] = [ ˉ Y ( Y

[404020404]β^=[111101011111]Y,
φ( β )= ˉ Y
[ϕ(β^)θ^2/2ϕ(β^)]=[Y¯(Y2Y4)/4Y¯],
ϕ(β^)=Y¯

따라서 옵션 D만이 정답입니다.


부록 : 추정 성과 식별성의 연결

내가 학교에있을 때, 교수는 파라 메트릭 기능성 의 추정 이 모델 식별 가능성과 일치 한다고 간단히 언급했다 . 나는이 주장을 당연한 것으로 여겼다. 그러나 동등성을보다 명확하게 설명해야합니다.ϕ

AC Davison의 논문 통계 모델 p.144 에 따르면 ,

정의 2. 각 모수가 다른 분포를 생성하는파라 메트릭 모델을 identifiable 이라고 합니다 .θ

선형 모델 에 관계없이 spherity 조건 으로이를 재 공식화 될 수 Var ( ε ) = σ 2 I E [ Y ] = X β ,(1)Var(ε)=σ2I

(2)E[Y]=Xβ,βRk.

응답 벡터 의 첫 번째 모멘트 형식 만 지정한 단순한 모델입니다 . 때 , 모델 식별되기 때문에 의미 (단어 원래의 정의에서 "분포", 자연적으로 평균 "에 감소 " 모델 아래에 있음 ).Yrank(X)=k(2)β1β2Xβ1Xβ2(2)

이제 이고 주어진 매개 변수 기능 라면 어떻게 정의 1정의 2를 조정 합니까?rank(X)<kϕ(β)=pβ

음표와 단어를 조작함으로써, ( "증거"가 다소 사소한) 의 추정 가능성은 매개 변수 로 매개 변수화 될 때 모델 를 식별 할 수 있는 것과 같다는 것을 보여줄 수 있습니다. (디자인 매트릭스 는 이에 따라 변경 될 수 있음) 증명하기 위해 가 추정 가능하여 의미 한다고 가정 , 이는 정의에 따라 이므로 모델 을 식별 할 수 있습니다 색인을 생성 할 때 . 반대로 모델 을 식별 할 수 있다고 가정 하면ϕ(β)(2)ϕ=ϕ(β)=pβXϕ(β)Xβ1=Xβ2pβ1=pβ2ϕ1=ϕ2(3)ϕ(3)Xβ1=Xβ2 의미 , 이는 입니다.ϕ1=ϕ2ϕ1(β)=ϕ2(β)

직관적으로, 가 순위가 낮아지면 가 있는 모델 은 매개 변수 중복 (너무 많은 매개 변수)이므로 중복되지 않은 낮은 차원의 재 매개 변수화 (선형 함수 모음으로 구성 될 수 있음)가 가능합니다. 그러한 새로운 표현은 언제 가능합니까? 열쇠는 추정 성입니다.Xβ

위의 진술을 설명하기 위해 예제를 다시 생각해 봅시다. 매개 변수 기능 및 가 추정 . 따라서 다음과 같이 재 파라미터 화 된 매개 변수 로 모델 을 다시 작성할 수 있습니다ϕ2(β)=θ1θ3ϕ3(β)=θ2(1)(ϕ2,ϕ3)

E[Y]=[10111011][ϕ2ϕ3]=X~γ.

분명히 가 전체 순위이므로 새로운 매개 변수 가진 모델을 식별 할 수 있습니다.X~γ


옵션 C의 두 번째 부분에 대한 증거가 필요하면 답변을 보충 해 드리겠습니다.
잔 시옹

2
감사! 그런 자세한 답변을 위해. 이제 C의 두 번째 부분에 대해 : "최고" 가 최소 분산과 관련이 있다는 것을 알고 있습니다. 따라서 가 "최고" 가 아닌 는 무엇입니까? 14(Y1+Y2+Y3+Y4)
Stat_prob_001 17

2
오, 나는 그것이 왜 C에서 견적이라고 생각하는지 모르겠습니다. 실제로 가 가장 좋은 견적입니다. 내 답변을 편집합니다(Y1+Y2+Y3+Y4)/4
Zhanxiong

6

정의를 적용하십시오.

기초 기술을 사용하는 방법을 설명하는 세부 정보를 제공합니다. 추정에 대한 특별한 이론을 알 필요가 없으며 의 (마진 적) 분포에 대해 아무것도 가정 할 필요가 없습니다 . 우리는 합동 분배 의 순간 에 대해 하나의 빠진 가정을 제공해야합니다 .Yi

정의

모든 선형 추정치 는 상수 의 경우 입니다 .

tλ(Y)=i=14λiYi
λ=(λi)

의 추정 IS 편견 경우 그 기대는 경우에만 . 기대의 선형성으로θ1θ3θ1θ3

θ1θ3=E[tλ(Y)]=i=14λiE[Yi]=λ1(θ1θ3)+λ2(θ1+θ2θ3)+λ3(θ1θ3)+λ4(θ1θ2θ3)=(λ1+λ2+λ3+λ4)(θ1θ3)+(λ2λ4)θ2.

미지수의 계수를 비교 밝혀θi

(1)λ2λ4=0 and λ1+λ2+λ3+λ4=1.

선형 비 편향 추정의 맥락에서 "최고"는 항상 최소의 분산을 의미합니다. 의 분산 은tλ

Var(tλ)=i=14λi2Var(Yi)+ij4λiλjCov(Yi,Yj).

진전을 만드는 유일한 방법은 공분산에 대한 가정을 추가하는 것입니다 . 대부분의 경우, 그것들을 규정하려는 의도는 모두 0입니다. (이것은 가 독립적 이라는 것을 의미하지는 않습니다 . 또한, 공분산을 공통 곱셈 상수까지 규정하는 가정을함으로써 문제를 해결할 수 있습니다. 솔루션은 공분산 구조에 의존합니다.)Yi

이후 우리가 구Var(Yi)=σ2,

(2)Var(tλ)=σ2(λ12+λ22+λ32+λ42).

따라서 문제는 제약 조건 을 최소화하는 것 입니다.(2)(1)

해결책

제약 조건 하면 모든 를 두 개의 선형 조합으로 표현할 수 있습니다. 하자 및 (선형 독립적이다). 이것들은 과 을 결정하지만 제약 조건은 와 결정 합니다. 우리가해야 할 일은 최소화 할 수 있습니다 , 쓸 수 있습니다(1)λiu=λ1λ3v=λ1+λ3λ1λ3λ2λ4(2)

σ2(λ12+λ22+λ32+λ42)=σ24(2u2+(2v1)2+1).

제약이 없습니다 . 가정 (따라서 변수가 아니라 상수 있음). 이후 및 때만 가장 작은 , 그 현재 분명 독특한 해결책이(u,v)σ20u2(2v1)2u=2v1=0

λ=(λ1,λ2,λ3,λ4)=(1/4,1/4,1/4,1/4).

옵션 (C)는 최상의 편향 선형 추정기를 제공하지 않기 때문에 거짓 입니다. 옵션 (D)는 완전한 정보를 제공하지는 않지만 정확하지만

θ2=E[t(0,1/2,0,1/2)(Y)]

선형 추정기의 기대치입니다.

선형 추정기 기대의 공간에서 생성되지 않기 때문에 그것은도 (A) 나 (B)의 정확한 수 있다는 것을 쉽게 알 수있다 과 없음 또는 이 해당 공간에 있습니다.θ 1 , θ 3 , θ 1 + θ 3{θ2,θ1θ3}θ1,θ3,θ1+θ3

결과적으로 (D)는 고유 한 정답입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.