평균과 분산이 알려진 경우 이변 량 정규 데이터의 공분산에 대한 최대 우도 추정치는 무엇입니까?


11

평균이 0이고 분산이 1 인 이변 량 정규 분포의 랜덤 표본이 있으므로 알 수없는 유일한 매개 변수는 공분산입니다. 공분산의 MLE는 무엇입니까? 나는 그것이 같은 것을해야한다 알고 하지만 우리가 어떻게 알 수 있습니까?1nj=1nxjyj


1
우선, 우리가 실제로 0과 0이라는 것을 알 때 와 하여 평균을 추정하는 것이 조금 어렵다고 생각하지 않습니까? x¯y¯
Wolfgang

매우 삼촌입니다. 여전히 어떻게 쉽게 따라갈 수 있는지 보지 못합니다. 샘플 차이와 유사하지만 왜 MLE입니까 (그렇지 않고 다른 실수를하지 않는 한)
Stacy

당신이 삭제 한 ? 이 공식을 취한다고해서 및 를 평균 의 추정치로 간주하는 것은 아닙니다 . 1ni=1n(xix¯)(yiy¯)x¯y¯
Stéphane Laurent

@ StéphaneLaurent 그렇습니다. 초기 포스트에서 공식은 여러분이 작성한대로 주어졌습니다.
Wolfgang

답변:


12

상관 계수 추정값 (이변 량 표준 법선의 경우 공분산과 동일)

r~=1ni=1nxiyi

샘플 공분산 인 모멘트 계산 방법입니다. 최대 우도 추정량 인 와 일치하는지 확인하십시오 .ρ^

상관 계수 를 갖는 이변 량 표준 법선의 접합 밀도 는ρ

f(x,y)=12π1ρ2exp{x2+y22ρxy2(1ρ2)}

따라서 크기가 iid 샘플의 로그 우도 는n

lnL=nln(2π)n2ln(1ρ2)12(1ρ2)i=1n(xi2+yi22ρxiyi)

(여기서 iid 가정은 물론 2 차원 인구의 각 추첨에 관한 것입니다)

에 대해 미분 촬영 과가 0으로 설정하는 것은 3 차원도를 제공 다항식 :ρρρ

ρ^:nρ^3(i=1nxiyi)ρ^2(11ni=1n(xi2+yi2))nρ^i=1nxiyi=0

실제 계수 -it 에서 평가 된 미분의 기대 값을 0으로 하면 계산이 올바른지 확인할 수 있습니다 .ρ

간결하게하기 위해 . 이는 와 의 표본 분산의 합입니다 . 1 차 미분 표현을 나누면 MoM 추정기가 나타납니다.(1/n)i=1n(xi2+yi2)=(1/n)S2XYn

ρ^:ρ^3r~ρ^2+[(1/n)S21]ρ^r~=0

ρ^(ρ^2r~ρ^+[(1/n)S21])=r~

대수학하고, 우리가 얻을 것이라고 결론 어려운 일이 아니다 경우에 한해, , 즉 샘플의 합이 같음을 편차를 너무 일이 발생하는 경우에만 있음 실제 분산의 합. 그래서 일반적으로ρ^=r~(1/n)S2=2

ρ^r~

여기서 어떻게됩니까? 누군가 현명하게 설명해 드리겠습니다. 시뮬레이션을 시도해 봅시다. 상관 계수 으로 두 표준 법선의 iid 샘플을 생성했습니다 . 샘플 크기는 이었다. 샘플 값은ρ=0.6n=1.000

i=1nxiyi=522.05,S2=1913.28

동작 방법 추정기는

r~=522.051000=0.522

로그 우도는 어떻게됩니까? 시각적으로, 우리는

여기에 이미지 설명을 입력하십시오

숫자 적으로, 우리는

ρ1st derivlnL0.570.92783.650.5159.41782.470.5247.7781.480.5335.78780.680.5423.64780.10.5511.29779.750.561.29779.640.5714.1779.810.5827.15780.270.5940.44781.050.653.98782.18

그리고 로그 우도는 이전에 최대 tad를 가지며 여기서 1 차 도함수는 0이됩니다 . 의 값에 대해서는 놀라운 것이 없습니다. 또한 1 차 도함수에는 다른 뿌리가 없습니다.ρ=0.56(ρ^=0.558985)ρ

따라서이 시뮬레이션은 최대 우도 추정기가 모멘트 추정기 (두 rv 사이의 표본 공분산)와 같지 않다는 결과와 일치합니다 .

그러나 "모두"는 누군가가 설명해야 한다고 말하고있는 것으로 보입니다 .

최신 정보

MLE가 동작 방법 추정기임을 증명하는 참고 문헌 : Anderson, TW, & Olkin, I. (1985). 다변량 정규 분포의 모수에 대한 최대 우도 추정. 선형 대수와 그 응용, 70, 147-171.
여기서 모든 평균과 분산이 다양하고 고정되어 있지 않다는 것이 중요합니까?

... 아마도 (지금 삭제 된) 답변에서 @guy의 의견에 따르면 주어진 평균 및 분산 매개 변수를 사용하면 이변 량 법선이 곡선 지수 패밀리 의 구성원이 되므로 일부 결과 및 속성이 변경됩니다. 두 결과를 조정할 수있는 유일한 방법 인 것 같습니다.


1
이것은 조금 놀라운 일이지만 약간의 성찰 후에 예상됩니다. 모델에서 회귀 계수 를 추정하는 것으로 문제를 해석 할 수 있습니다. 여기서 . 이것은 선형 모델이 아니므로 MLE이 단순한 내적 일 것으로 기대할 이유가 없습니다. 우리가 만 알면 MLE는 이고 만 알면 라는 동일한 논리가 (제 생각에) 생각됩니다. . 우리가 둘 다 알지 못하면 MOM 견적서를 얻습니다. ρY=ρX+ϵϵN(0,1ρ22)Var(X)xy/xxxy/yyVar(Y)
guy

1
@guy : 매우 흥미 롭습니다. 나는 이러한 주장이 약간 확장되면 완전히 별도의 답변으로 게시 할 가치가 있다고 생각합니다!
amoeba

@guy 회귀 설정의 로그 우도에는 정사각형 포함되어 있기 때문에이 공식이 동등하지 않다고 생각합니다. . 부착 계수 이변 량 밀도 제제 내에 존재하지 않는다. ϵ2=(yρx)2=y22ρxy+ρ2x2ρ2x2
Alecos Papadopoulos

내 생각 엔 입니다. 상상 및 ,이어서 추정치가 예상된다. 1ni=1n(xix¯)(yiy¯)n=2y1=y20
Stéphane Laurent

1
@AlecosPapadopoulos 2-2 . 용어 분모에 의해 취소되는 , 원래의 로그 우도의 기여가 있음 데이터로부터 만 용어이므로 . 그러나 이것은 잘 알려진 인수 분해 , . 용어 를 포함 때문에 다른 주장은 잘못 되었습니다. x2+y22ρxy=(1ρ2)x2+(yρx)2(1ρ2)x2(1ρ2)(yρx)2/(1ρ2)XN(μX,σX2)[Y|X]N(μY+ρXσYσX(XμX),σY|X21ρ22)σY/σX
남자

2

명시된 조건 ( 및 )에서 크기 의 랜덤 표본에 대한 우도 함수 는μX=μY=0σX=σY=1n

L(ρ|X,Y)=1(2π[1ρ2])n/2exp[12(1ρ2)(XX2ρXY+YY)].

이제 로그 우도를 찾고 와 관련하여 미분을 취하십시오 . 그런 다음 해결하여 0으로 설정하십시오 . 물론 발견 한 것이 실제로는 최대 값임을 나타 내기 위해 적절한 테스트를 수행해야합니다.ρρρ^

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.