불가능한 추정 문제?


17

질문

음 이항 분포 (NB)의 분산은 항상 평균보다 큽니다. 표본의 평균이 분산보다 큰 경우 최대 가능성 또는 모멘트 추정으로 NB의 모수를 맞추려고하면 실패합니다 (유한 모수를 가진 해는 없습니다).

그러나 NB 분포에서 추출한 표본의 평균이 분산보다 큽니다. 다음은 R의 재현 가능한 예입니다.

set.seed(167)
x = rnbinom(100, size=3.2, prob=.8);
mean(x) # 0.82
var(x) # 0.8157576

NB가 모수를 추정 할 수없는 (최대 우도 및 모멘트 방법으로) 표본을 생성 할 확률은 0이 아닙니다.

  1. 이 표본에 대해 적절한 추정치를 제공 할 수 있습니까?
  2. 추정이 모든 표본에 대해 정의되지 않은 경우 추정 이론은 무엇을 말합니까?

답변에 대해

@MarkRobinson과 @Yves의 답변은 매개 변수화가 주요 문제임을 깨달았습니다. NB의 확률 밀도는 일반적으로

P(X=k)=Γ(r+k)Γ(r)k!(1p)rpk
또는
P(X=k)=Γ(r+k)Γ(r)k!(rr+m)r(mr+m)k.

첫 번째 모수화 에서 표본의 분산이 평균보다 작을 때마다 최대 우도 추정값은 이므로 p 에 대해 유용한 것은 없습니다 . 두 번째에서는 ( , ˉ x ) 이므로 합리적인 추정치 m을 줄 수 있습니다 . 마지막으로 @MarkRobinson은 r 을 사용하여 무한 값의 문제를 해결할 수 있음을 보여줍니다.(,0)p(,x¯)m 대신R.r1+rr

결론적으로,이 추정 문제에는 근본적으로 아무 문제가 없습니다. 단, 모든 표본에 대해 항상 p 를 의미있게 해석 할 수는 없습니다 . 공평하게, 아이디어는 두 가지 답변에 모두 있습니다. 나는 그가 제공하는 보완 물에 대한 올바른 것으로 @MarkRobinson의 것을 선택했습니다.rp


이 경우 최대 가능성이 실패한다고 진술하는 것은 올바르지 않습니다. 순간 방법 만이 어려움에 직면 할 수 있습니다.
시안

@ Xi'an 확장 할 수 있습니까? 이 샘플의 가능성은 도메인 에서 최대 값을 갖지 않습니다 ( 예를 들어 이것을 참조하십시오 ). 뭔가 빠졌습니까? 어쨌든 ML 에이 경우 매개 변수의 추정치를 줄 수 있다면 질문을 업데이트 할 것입니다. (0,)×(0,1)
gui11aume

1
r ∞의 무한 거리에서 최대 값을 가질 수 있습니다 . 비슷한 문제이지만 진단이 더 간단한 Lomax 분포에 대한 것입니다. 표본의 변동 계수가 CV < 1 인 경우 모양의 ML 추정치는 무한대 인 것으로 알려져 있습니다. 그러나이 사건의 확률은 모든 표본 크기에 대해 양수이며 α = 20n = 200 과 같이 매우 강합니다 . p0rCV<1α=20n=200
이브

@Yves이 다른 예에 대해 감사합니다 (알지 못했던). 이 경우 사람들은 무엇을합니까?
gui11aume

2
Lomax 예에서 일부 사람들은 지수 분포를 사용하기로 선택했습니다. 이는 λ / α θ > 0 의 한계입니다 . 이것은 무한한 ML 추정을 받아들이는 것으로 요약됩니다. 재 모수화에 의한 불일치를 위해, 무한 매개 변수가 어떤 경우에는 의미가 있다고 생각합니다. NB 예제의 경우 r p / ( 1 - p ) λ 에서 나온 포아송 분포를 사용하기로 선택한 경우에도 마찬가지 입니다. αλ/αθ>0rp/(1p)λ
이브

답변:


11

enter image description here기본적으로 샘플의 경우 크기 매개 변수의 추정치는 매개 변수 공간의 경계에 있습니다. d = size / (size + 1)과 같은 매개 변수화를 고려할 수도 있습니다. size = 0, d = 0 일 때 크기가 무한대 인 경우 d는 1에 접근합니다. 지정한 매개 변수 설정에 대해 무한대 크기 추정치 (1에 가까워짐)는 약 13 %의 시간 동안 발생합니다. 콕스-레이드 조정 된 프로파일 우도 (APL) 추정치. 이는 NB에 대한 MLE 추정치의 대안입니다 (여기에 표시된 예) . 평균 모수 (또는 'prob')의 추정치는 정상인 것 같습니다 (그림 참조, 파란색 선은 실제 값이고 빨간색 점은 시드 = 167 표본의 추정치입니다). APL 이론에 대한 자세한 내용은 여기에 있습니다 .

그래서, 나는 1이라고 말할 것입니다 : 적절한 파라미터 추정치가있을 수 있습니다. 다른 모수 공간을 고려하면 추정치는 유한합니다.


내 질문에 대답하기 위해 사이트에 가입 해 주셔서 감사합니다! Cox-Reid 조정 프로파일 가능성의 세부 사항은 매우 유망한 것으로 보입니다.
gui11aume

8

p0rΘ:=(0,1)×(0,)λ>0[p,r]Θp0rrp/(1p)λ

CV<1>0.3α=20n=200

ML 특성은 큰 표본 크기를위한 것입니다. 규칙적인 조건에서 ML 추정값은 존재하고 고유하며 실제 매개 변수를 나타내는 경향이 있습니다. 그러나 주어진 유한 샘플 크기에 대해 ML 추정치는 예를 들어 경계에서 최대 값에 도달하기 때문에 도메인에 존재하지 않을 수 있습니다. 또한 최대화에 사용 된 것보다 큰 도메인에 존재할 수 있습니다.

αλ/αθ>0GPD(σ,ξ)ξ>0ξ^<0ξ^=0

재 모수화에 의한 불일치 때문에, 무한 매개 변수가 어떤 경우에는 의미가 있다고 생각합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.