작은 표본에서 모멘트 방법이 최대 가능성을 능가 할 수있는 예는 무엇입니까?


57

최대 가능성 추정기 (MLE)는 점진적으로 효율적입니다. 표본 크기가 작은 경우에도 MoM (Method of Moments) 추정치 (상이한 경우)보다 종종 더 나은 점에서 실제적인 결과를 볼 수 있습니다.

여기서 "보다 낫다"는 일반적으로 둘 다 편향되지 않은 경우 분산이 더 작고 일반적으로 더 작은 평균 제곱 오차 (MSE)가 작다는 의미입니다.

그러나 문제는 다음과 같습니다.

작은 샘플에서 MoM이 MLE-on MSE를 이길 수있는 경우가 있습니까?

(이것은 이상한 / 퇴화적인 상황이 아닌 곳, 즉 ML이 존재 / 무조건 효율적으로 유지되는 조건을 감안할 때)

후속 질문은 '작은 것이 얼마나 클 수 있는가?'입니다. 즉, 예가 있다면, 상대적으로 큰 샘플 크기, 아마도 모든 유한 샘플 크기를 유지하는 샘플이 있습니까?

[유한 샘플에서 ML을 이길 수있는 바이어스 추정기의 예를 찾을 수 있지만 MoM은 아닙니다.]


소급하여 추가 된 참고 사항 : 여기에서의 나의 초점은 주로 일 변량 사례 (실제로 내 기본 호기심이 시작되는 곳)에 있습니다. 다변량 사례를 배제하고 싶지는 않지만 특히 James-Stein 추정에 대한 확장 된 논의에 빠져들고 싶지 않습니다.


문제 없어요; 그것은 우리 모두에게, 그리고 당신보다 더 자주 나에게 일어난다. 제목에 올바르게 입력해야했지만 이미 꽤 길었습니다.
Glen_b

@cardinal 나는 지금 기준을 더 명확하게 만들었습니다.
Glen_b

3
순간의 방법이 최대 가능성을 "이길"수있는 다른 방법이 있습니다. 예를 들어, 일반 혼합 추정 문제에서 MLE은 계산하기 어려운 반면 MLE은 계산하기 어렵습니다.
vqv

@vqv 확실히 그것은 MoM이 바람직하다는 의미입니다.
Glen_b

2
I는 평민 동정하는 경향이 있기 때문에, I는 IID 유니폼 샘플의 것이 알려 에 대한 전월 추정기 샘플 사이즈 인 경우 귀족 (MLE)와 동일한 MSE를 갖는 또는 ... 그러나 아아, 더 큰 표본 크기를 위해, 귀족은 그의 주권을 다시 주장한다 ...θ 1 2U(0,θ)θ12
Alecos Papadopoulos

답변:


36

이것은 부정 행위로 간주 될 수 있지만 OLS 추정기는 MoM 추정기입니다. 표준 선형 회귀 사양 ( 확률 적 회귀를 사용하여 크기는 회귀 행렬에 대한 조건부)과 크기 의 표본을 고려하십시오 . 오류 항의 분산 의 OLS 추정값을 나타냅니다 . 편견이 없으므로n s 2 σ 2Kns2σ2

MSE(s2)=Var(s2)=2σ4nK

이제 의 MLE을 고려하십시오 . 그것은σ2

σ^ML2=nKns2
편향되어 있습니까? MSE는

MSE(σ^ML2)=Var(σ^ML2)+[E(σ^ML2)σ2]2
OLS와 관련하여 MLE을 표현하고 우리가 얻는 OLS 추정기 분산에 대한 표현식 사용

MSE( σ 2 M의 L )=2(N-K)+K2

MSE(σ^ML2)=(nKn)22σ4nK+(Kn)2σ4
MSE(σ^ML2)=2(nK)+K2n2σ4

우리는 (있는 경우) 조건을 원합니다

MSE(σ^ML2)>MSE(s2)2(nK)+K2n2>2nK

2(nK)2+K2(nK)>2n2
2n24nK+2K2+nK2K3>2n2
간단히하면 의이 2 차는 음수 값을 얻을 수 있습니까? 우리는 긍정적 인 차별이 필요합니다. 우리가 에서 다른 차이며 이 시간. 이 판별자는 이므로 는 이 정수라는 사실을 고려합니다 . 만약
4n+2K+nKK2>0K2(n+2)K+4n<0
K
ΔK=(n+2)216n=n2+4n+416n=n212n+4
n
Δn=12242=816
nnΔK<0K
n1,n2=12±8162=6±42n1,n2={1,12}
nn이 간격 내에 있습니다. 이고 의 2 항상 양의 값을 취하므로 필요한 부등식을 얻을 수 없습니다. 따라서 우리는 12보다 큰 표본 크기가 필요합니다.ΔK<0K

의 뿌리이에게 주어 있습니다 -quadraticK

K1,K2=(n+2)±n212n+42=n2+1±(n2)2+13n

전체 : 샘플 크기 및 회귀 수 되도록 우리가 들어 예를 들어, 인 경우 , 불평등이 유지 되기 위해서는 회귀 자 수가 이어야한다는 것을 알게 됩니다. 적은 수의 회귀 분석기에서 MLE이 MSE 의미에서 더 낫다는 것이 흥미 롭습니다.n>12KK1<K<K2

MSE(σ^ML2)>MSE(s2)
n=505<K<47

부록 이차
의 근에 대한 방정식을 쓸 수 있습니다K

K1,K2=(n2+1)±(n2+1)24n
내가 얼핏로 생각하는 그 낮은 루트는 항상 것입니다 의미 "정수 값"제한을 고려하여 여야 합니다. 따라서 모든 유한 한 표본 크기에 대해 회귀자가 최대 때 MLE가 MSE 효율적 입니다.55

1
사양과 함께 제공되는 이론적 모멘트 조건은 입니다. 우리가 의 샘플 유사체 를 대한 추정기로 사용하는 정도로 , 나는 그것이라고 말할 것입니다. E(uuX)=σ2E(uuX)σ2
Alecos Papadopoulos

1
@AlecosPapadopoulos "샘플 아날로그" 는 분모에 대해 을 취할 것입니다 . 즉 MLE과 같습니다. 이론적 기대치를 경험적 기대로 대체한다면 분모에서 어떻게 로 끝날 수 있습니까? 자연스런 모멘트 조건은 이고 여야하며 경험적 기대치로 바꾸면 분모가 됩니다. nnKE[Xk(YXβ)]=0E[(YXβ)2]=σ2n
guy

2
@guy 그것은 유효한 발언입니다. 나에게있어 자유도 보정은 항상 Method of Moments의 개념적 문제였습니다. 모든 "샘플 유사체"엄격한 개념은없고, 그것으로 나누어, 기대치와 뷰트 점근선 워크 후자의 점근 대응 통해 "샘플 수단"의 개념과 연결 후 대신 수행 아무런 차이가 없습니다. 나를 위해 그것은 해결되지 않은 문제로 남아 있습니다. 반면, 최대 우도 추정치는 우도 방정식에 의해 구체적으로 결정되며, MoM과 일치하거나 일치하지 않을 수 있습니다. (CONTD)nKn
Alecos Papadopoulos

1
@guy (계속). 그래서 당신이 말하는 것은이 경우 오류 분산의 전월 추정이 있다는 것입니다 이다 최대 우도 추정하고, 그래서 도출 된 결과는 ML로 전월하지 비교,하지만 OLS와 ML이 (후자는 그 자체 범주 인). .. 그렇습니다. 이것은 또한 사실이기도합니다.
Alecos Papadopoulos

1
"MoM 견적"과 같은 것이 있습니까? "MOM 견적 자"맞지? 만약 랜덤하게 선택된 잔류 OLS 취하면 이어서, . 그것은 완벽하게 좋은 순간 조건입니까? 그리고 그것은 대해 완벽하게 좋은 MoM을 제공합니다 . 즉, 일반적인 OLS 추정 기인 입니다. eE(e2)=nknσ2σ2s2
Bill

17

"이 기사에서는 2 모수 역 가우스 분포의 새로운 매개 변수화를 고려합니다. 모멘트 방법과 최대 우도 방법에 의해 역 가우시안 분포의 모수에 대한 추정값을 찾습니다. 바이어스 및 평균 제곱 오차 (MSE)를 기준으로 두 가지 방법에 대한 추정기이를 위해 매개 변수 값을 수정하고 시뮬레이션을 실행하며 두 방법으로 얻은 추정치에 대한 MSE 및 바이어스를보고합니다. 샘플 크기가 10 일 때, 모멘트 방법은 두 모수 (람다 및 세타)의 추정에 대한 최대 우도 방법보다 더 효율적인 경향이 있습니다 .... " 더 읽기

요즘에는 출판 된 모든 내용을 신뢰할 수 없거나 신뢰할 수 없지만 논문의 마지막 페이지는 유망한 것으로 보입니다. 이 내용이 소급하여 추가 된 메모를 처리하기를 바랍니다.


1
이 기사의 표를 올바르게 이해하면 일부 표본 크기에서 정확하다고 생각합니다. 모서리 방법 (문서의 MME)은 적어도 추정에서 MLE을 능가하는 것으로 보입니다 . (그러나 시뮬레이션 결과 중 일부는 약간 이상하게 보입니다. 예를 들어 p49에서 가장 오른쪽 열의 진행). 이것은 역 가우시안이 비교적 널리 사용되기 때문에 매우 흥미로운 결과입니다. θ
Glen_b

잘 찾아라! 결과가 꺼져 있더라도 주장이 어딘가에 명시 적으로 언급되어있는 것이 좋습니다.
Ben Ogorek

내 답변에 링크 된 논문은 MSc 논문에서 유래했으며, 전체 내용은 다음과 같습니다. digi.library.tu.ac.th/thesis/st/0415 관련 내용은 섹션 5.2를 참조하십시오. 정식 교수를 포함한 6 명이이 결과에 서명했습니다.
동면

14

Hosking and Wallis (1987)가 "일반화 된 파레토 분포에 대한 모수 및 분위수 추정"에서 실행 한 시뮬레이션에 따르면, cdf에 의해 주어진 2 모수의 일반화 된 파레토 분포의 모수

G(y)={1(1+ξyβ)1ξξ01exp(yβ)ξ=0

또는 밀도

g(y)={1β(1+ξyβ)11ξξ01βexp(yβ)ξ=0

ML과 달리 MOM을 통해 추정되는 경우 더 신뢰할 수 있습니다. 이는 최대 500 크기의 표본에 적용됩니다. MOM 추정치는 다음과 같이 계산됩니다.

β^=y¯y2¯2(y2¯(y¯)2)

ξ^=12(y¯)22(y2¯(y¯)2)

y2¯=1ni=1nyi2

이 논문에는 꽤 많은 오타가 포함되어 있습니다 (적어도 내 버전에서는 가능합니다). 위에 주어진 MOM 추정기의 결과는 이 스레드 에서 "heropup"에 의해 친절하게 제공되었습니다 .


고마워 지금까지 내가 찾던 가장 간단한 예 중 하나입니다.
Glen_b 2016 년

13

나는 하나를 발견했다.

비대칭 지수 전원 분배

f(x)=ασΓ(1α)κ1+κ2exp(κασα[(xθ)+]α1κασα[(xθ)]α),α,σ,κ>0, and x,θR

Delicado and Goria (2008)의 시뮬레이션 결과는 더 작은 표본 크기에서 일부 매개 변수의 경우 모멘트 방법이 MLE보다 우수 할 수 있다고 제안합니다. 예를 들어, 샘플 크기 10 의 알려진 사례에서, 추정 할 때 , MoM의 MSE는 ML보다 작다.θσ

Delicado and Goria (2008),
비대칭 지수 분포에 대한 최대 우도, 모멘트 및 L- 모멘트 방법의 작은 샘플 비교,
Journal Computational Statistics & Data Analysis
Volume 52 Issue 3, January, pp 1661-1673

( http://www-eio.upc.es/~delicado/my-public-files/LmomAEP.pdf 참조 )


13

모멘트 방법 (MM)은 일부 모집단 모멘트 만 지정할 수있는 경우 최대 우도 (ML) 접근법을 능가 할 수 있습니다. 분포가 잘못 정의 된 경우 ML 추정기는 일관되지 않습니다.

유한 모멘트와 iid 관찰을 가정하면 MM은 우수한 추정 특성을 제공 할 수 있습니다.

예 : 하자 의 IID 샘플 수 여기서, 미지의 확률 밀도 함수이다. 정의 순간 번째와 관심이 전후 모멘트 추정하는 것을 고려 .X1,,XnXff:RR+νk=Rxkf(x)dxkν4

하자 , 다음 가정하여 그 , 중심 극한 정리 보장 여기서 " "은 "배포의 수렴"을 의미합니다. . 또한, 슬 루츠 키 정리에 따르면Xk¯=1ni=1nXikν8<

n(X4¯ν4)dN(0,ν8ν42),
d

n(X4¯ν4)X8¯X4¯2dN(0,1)
이후 (확률 수렴).X8¯X4¯2Pν8ν42

즉, 모멘트 접근법 (큰 표본의 경우)을 사용하여 에 대한 (추정적인) 추론을 도출 할 수 있습니다 . 관심있는 모멘트에 대한 가정 만하면됩니다. 여기에서 의 모양을 모르면 최대 가능성 추정값을 정의 할 수 없습니다 . fν4f

시뮬레이션 연구 :

Patriota et al. (2009)는 변수 오류 모델에서 가설 검정의 거부율을 검증하기 위해 일부 시뮬레이션 연구를 수행했습니다. 결과는 MM 접근법이 작은 표본에 대한 ML보다 공칭 수준에 가까운 귀무 가설 하에서 오류율을 생성 함을 제안합니다.

역사적 메모 :

순간의 방법은 1894 년 K. Pearson에 의해 제안되었습니다. "수학적 진화 이론에 대한 기여". 최대 가능성의 방법은 1922 년 RA Fisher에 의해 "이론적 통계의 수학적 기초"에서 제안되었습니다. 런던 왕립 학회의 철학적 거래, 시리즈 A에 실린 두 논문.

참고:

피셔, RA (1922). 이론적 통계의 수학적 기초, 런던 왕립 학회의 철학적 거래, 시리즈 A, 222, 309-368.

Patriota, AG, Bolfarine, H, de Castro, M (2009). 방정식 오류, 통계적 방법론 6 (4), 408-423 ( pdf )이 있는이 분산 구조적 변수 오류 모델

피어슨, K (1894). 진화의 수학적 이론에 기여, 런던 왕립 학회의 철학적 거래, 시리즈 A, 185, 71-110.


1
귀하의 답변은 잠재적으로 흥미로운 답변처럼 들립니다. 조금 확장 할 수 있습니까? 잘 모르겠습니다.
Glen_b

@Glen_b 마지막으로 추가 한 내용이 도움이되는지 확인하십시오.
Alexandre Patriota

감사합니다. 나는 당신이 무엇을 얻고 있는지 믿습니다.
Glen_b

좋아요, 일반적인 의견이지만 귀하의 질문에 대한 답변이라고 생각합니다. 데이터 동작에 대한 전체 정보를 제공하는 경우 ML 방식이 MM 방식보다 성능이 뛰어납니다. 논문 [1]에서 우리는 변수 오류 모델에서 가설 검정의 거부율을 검증하기위한 시뮬레이션 연구를 수행합니다. 결과는 MM 접근법이 작은 표본에 대한 ML보다 공칭 수준에 가까운 귀무 가설 하에서 오류율을 생성 함을 제안합니다. [1] ime.usp.br/~patriota/STAMET-D-08-00113-revised-v2.pdf
Alexandre Patriota

이것은 MoM (Method of Moments)의 비정형적인 예입니다. MoM은 일반적으로 잘 정의 된 모수 분포 군이있는 모수 추정 문제에 배치됩니다. 반면에 비모수 적 최대 우도 추정치를 여기에서 정의 할 수 있습니다. F-hat과 같은 경험적 분포 함수는 알려지지 않은 분포 함수 F의 비모수 적 최대 가능성 추정치입니다. . 이것은 샘플 4 번째 순간과 동일합니다.
vqv

5

MOM에 유리한 추가 출처 :

홍, HP, W. 예. 2014. 눈 깊이 기록을 사용한 캐나다의 극심한 지상 적설량 분석 . 자연 재해 73 (2) : 355-371.

표본 크기가 작은 경우 MML을 사용하면 비현실적인 예측이 가능합니다 (Hosking et al. 1985; Martin and Stedinger 2000).


Martins, ES 및 JR Stedinger. 2000 일반화 최대 - 우도 수문 데이터 극한 분위수 값 추정기 일반화 . 수자원 연구 36 (3) : 737-744.

요약:

3 파라미터 일반화 된 극단 값 (GEV) 분포는 연간 홍수, 강우, 풍속, 파도 높이, 눈 깊이 및 기타 최대치를 설명하는 데 광범위하게 적용됩니다. 이전 연구에 따르면 모수의 소 표본 최대 우도 추정량 (MLE)이 불안정하고 L 모멘트 추정기가 권장됩니다. 보다 최근의 연구에 따르면, 양자화 추정기의 모멘트 방법은 L 모멘트 및 MLE보다 -0.25 <κ <0.30 더 작은 제곱 평균 오차를 갖습니다. 작은 샘플에서 MLE의 거동을 조사하면 GEV- 형 매개 변수 κ의 터무니없는 값이 생성 될 수 있음을 보여줍니다. 일반화 된 최대 우도 (GML) 분석에서 κ 값을 통계적으로 / 물리적으로 합리적인 범위로 제한하기 위해 베이지안 사전 분포를 사용하면이 문제가 해결됩니다.

Introduction and Literature Review (소개 및 문헌 검토) 섹션에서 추가 논문을 인용하여 MOM이 MLE보다 성능이 우수하다는 결론을 내 렸습니다.

Hosking et al. [1985a]는 소 표본 MLE 매개 변수 추정기가 매우 불안정하며 L 순간 추정기와 동등한 확률 가중치 모멘트 (PWM) 추정기를 권장한다 [Hosking, 1990]. [...]

Hosking et al. [1985a]는 GEV 분포에 대한 확률 가중 모멘트 (PM) 또는 등가 L 모멘트 (LM) 추정기가 15에서 100까지 다양한 샘플 크기에 대한 바이어스 및 분산 측면에서 최대 가능성 추정기 (MLE)보다 우수함을 보여주었습니다. 보다 최근에는 Madsen et al. [1997a]는 표본 크기가 10-50 인 100 년 사건을 추정 할 때 MOM (moments of moments) Quantile Estimator가 LM 및 MLE보다 -0.25 <K <0.30에 대해 RMSE (root-mean-squareer ror)가 작다는 것을 보여주었습니다. . MLE는 K> 0.3이고 샘플 크기가 보통 일 때만 권장됩니다 (n> = 50).

K (kappa)는 GEV의 모양 매개 변수입니다.

따옴표로 묶인 논문 :

Hosking J, Wallis J, Wood E (1985) 확률 가중 모멘트 방법에 의한 일반화 된 극단 값 분포 추정 . 기술 통계 27 : 251–261.

Madsen, H., PF Rasmussen 및 D. Rosbjerg (1997) 극한 수 문학적 사건을 모델링하기위한 연간 최대 시리즈 및 부분 기간 시리즈 방법 비교 , 1, 현장 모델링, 물 Resour. Res., 33 (4), 747-758.

Hosking, JRM, L-moments : 주문 통계의 선형 조합을 사용한 분포 분석 및 추정 , JR Stat. Soc., Ser. B, 52, 105-124, 1990.


또한, 위의 논문에서 결론 지은 것과 같은 경험을 가지고 있습니다. 작고 중간 크기의 샘플 크기 (<50-100)로 극단적 인 이벤트를 모델링하는 경우 MLE가 비현실적인 결과를 제공 할 수 있습니다. 시뮬레이션에 따르면 MOM이 더 강력하고 더 작은 RMSE.


3

이 대답에 대한 과정 에서 이항에 대한 모수 추정 은이 논문을 우연히 발견했습니다.

Ingram Olkin, A John Petkau, James V Zidek : 이항 분포에 대한 N 추정량의 비교. Jasa 1981.

이것은 경우에 따라 순간의 방법이 최대 가능성을 능가하는 예를 제공합니다. 문제는 두 모수 모두 알 수없는 이항 분포 에서 을 추정하는 것입니다 . 예를 들어 모든 동물을 볼 수 없을 때 동물의 풍부도를 추정하려고 할 때, 관찰 확률 도 알 수 없습니다.( N , p ) pNBin(N,p)p


이 예제에서 매우 좋은 점 중 하나는 상황을 전달하는 것이 매우 간단하다는 것입니다. 많은 사람들이 이항에 익숙합니다 (적어도 개념적으로는 이름이 아닐지라도).
Glen_b
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.