삼각형 분포에 대한 MLE?


12

삼각형 분포에 일반적인 MLE 절차를 적용 할 수 있습니까? -노력하고 있지만 분포가 정의되는 방식으로 수학에서 한 단계 또는 다른 단계에서 차단 된 것 같습니다. c 위와 아래의 샘플 수를 알고 있다는 사실을 사용하려고합니다 (c를 모르고) :이 두 숫자는 cn이고 (1-c) n입니다 .n이 총 샘플 수인 경우. 그러나 그것은 파생에 도움이되지 않는 것 같습니다. 순간의 순간은 많은 문제없이 c에 대한 추정기를 제공합니다. MLE에 대한 방해의 정확한 본질은 무엇입니까?

자세한 내용은:

이제 생각해 보자 의 와 정의 분포 에 의해를 : [ 0 , 1 ] [ 0 , 1 ][0,1][0,1]

f(x;c)=2(1x)f(x;c)=2xc 의 경우, X <C의 의 경우 C <= X
f(x;c)=2(1x)(1c)

이 분포에서이 표본에 대해 c의 로그 우도를 위해 표본 을 보자 .{ x i }n{xi}

l^(c|{xi})=i=1nln(f(xi|c))

나는 다음의 형태로 주어진 사실 사용하는 것을 시도하고있다 , 우리가 알고 샘플은 (알 수없는) 이하로 떨어질 것 하고, 이상 떨어질 . IMHO, 이것은 로그 가능성의 표현에서 합산을 분해 할 수 있습니다.fcnc(1c)nc

l^(c|{xi})=i=1cnln2xic+i=1(1c)nln2(1xi)1c

여기에 진행 방법이 확실하지 않습니다. MLE는 로그 우도의 미분 wrt 를 취하는 것을 포함 하지만, c 를 합산의 상한으로 사용합니다. 표시기 함수를 사용하여 다른 형태의 로그 가능성으로 시도 할 수 있습니다.cc

^(|{엑스나는})=나는=1{엑스나는<}2엑스나는+나는=1{<=엑스나는}2(1엑스나는)1

그러나 Dirac 델타는 계속 사용할 수 있지만 지표를 도출하는 것은 쉽지 않습니다 (우리는 제품을 도출해야하기 때문에 지표를 보유하고 있음).

그래서 여기에 MLE가 차단되었습니다. 어떤 생각?


일부 주제에 해당되는 경우 자체 학습 태그를 추가하십시오. 그렇지 않은 경우 문제가 발생하는 방법을 설명하십시오.
Glen_b-복지 주 모니카

업데이트 해 주셔서 감사합니다. 처리 할 수있는 사례의 범위가 크게 줄어들 기 때문에 합리적인 답변을 말하기가 훨씬 쉬워집니다. 내 이전 의견을 고려해 주시겠습니까? 이것은 스스로 학습 태그에 속하거나 그렇지 않은 경우에 당신이 무언가를 할 것인지 물었습니다.
Glen_b-복지 주 모니카

이것은 숙제 나 수업을위한 것이 아닙니다. 내 일에서 일어난다. 우리는 순간의 다른 방법으로 추정기를 가지고 있지만 여기서 MLE로 무슨 일이 일어나고 있는지에 대해 더 깊이 이해하려고합니다.
Frank

괜찮아; 저에게 더 많은 여유를줍니다. 업데이트 된 답변을 참조하십시오. 아마 곧 추가 될 것입니다
Glen_b-복지국 Monica

추가 된 참조 / 링크
Glen_b-복지국 Monica

답변:


10

삼각형 분포에 일반적인 MLE 절차를 적용 할 수 있습니까?

확실히! 처리해야 할 몇 가지 이상한 점이 있지만이 경우 MLE을 계산할 수 있습니다.

그러나 '일반적인 절차'에 따라 '로그 우도의 파생물을 가져 와서 0으로 설정'을 의미한다면 그렇지 않을 수 있습니다.

MLE에 대한 방해의 정확한 본질은 무엇입니까?

가능성을 그려 보셨습니까?

-

질문의 명확화 후 후속 조치 :

가능성을 끌어내는 것에 대한 질문은 유휴 논평이 아니라 문제의 중심이었습니다.

MLE는 파생 상품을 포함합니다

MLE는 함수의 argmax를 찾는 것과 관련이 있습니다. 여기에는 특정 조건에서 도함수 0을 찾는 것만 포함됩니다. 기껏해야 그렇게 할 경우 몇 가지 지역 최소값을 식별하게 됩니다.

이전 질문에서 제안했듯이 가능성을 살펴보십시오 .

다음 은 (0,1)의 삼각 분포에서 관측 한 10 개의 관측 값 중 개 샘플입니다 .와이

0.5067705 0.2345473 0.4121822 0.3780912 0.3085981 0.3867052 0.4177924
0.5009028 0.8420312 0.2588613

해당 데이터의 에 대한 우도 및 로그 우도 함수는 다음과 같습니다 . 삼각의 피크 가능성

삼각 피크에 대한 로그 우도

회색 선은 데이터 값을 표시합니다 (값을 더 잘 분리하기 위해 새 샘플을 생성했을 것입니다). 검은 점은 해당 값의 가능성 / 로그 가능성을 표시합니다.

자세한 내용을 볼 수있는 최대 가능성에 가까운 확대는 다음과 같습니다.

가능성의 세부 사항

가능성에서 알 수 있듯이 많은 주문 통계에서 가능성 함수에는 날카로운 '모퉁이'가 있습니다-파생물이 존재하지 않는 지점 (놀랍지 않습니다-원본 pdf에 모서리가 있으며 우리는 pdf의 제품). 이것은 (주문 통계에 교두가 있음) 삼각 분포의 경우이며, 최대는 항상 주문 통계 중 하나에서 발생합니다. (주문 통계가 삼각 분포에 고유하지 않은 경우 이러한 교착 현상이 발생합니다. 예를 들어 Laplace 밀도에는 코너가 있으며 결과적으로 중심의 가능성은 각 주문 통계마다 하나씩 있습니다.)

샘플에서와 같이 최대 값은 4 차 통계량 0.3780912로 발생합니다.

유용한 참고 자료는 Johan van Dorp와 Samuel Kotz 의 " Beyond Beta " 1 장 입니다. 이와 같이 1 장은 책의 무료 '샘플'장입니다 . 여기서 다운로드 할 수 있습니다 .

Eddie Oliver의 삼각형 분포에 관한이 문제에 관한 멋진 작은 논문이 있습니다. American Statistician에서 생각합니다 (기본적으로 같은 점을 만듭니다. 교사 코너에 있다고 생각합니다). 그것을 찾을 수 있다면 그것을 참조로 줄 것입니다.

편집 : 여기 있습니다 :

EH Oliver (1972), 최대 가능성 확률,
미국 통계 학자 , Vol 26, Issue 3, June, p43-44

(게시자 링크 )

쉽게 파악할 수 있다면 살펴볼 가치가 있지만 Dorp와 Kotz 장은 대부분의 관련 문제를 다루므로 중요하지 않습니다.


의견에 대한 질문에 대한 후속 조치를 통해 모서리에서 '부드러운 부분을 매끄럽게하는'방법을 찾을 수는 있지만 여러 지역 최대치를 얻을 수 있다는 사실을 처리해야합니다.

두 개의 로컬 최대

그러나 속성이 매우 좋은 (모멘트 방법보다 나은) 추정값을 쉽게 찾을 수 있습니다. 그러나 삼각형 (0,1)의 ML은 몇 줄의 코드입니다.

엄청난 양의 데이터가 문제라면 처리 할 수는 있지만 또 다른 질문 일 것입니다. 예를 들어, 모든 데이터 포인트가 최대가 될 수있는 것은 아니므로 작업이 줄어들고 다른 절감 효과도 있습니다.


감사합니다. 실패한 시도를 게시하여 정확히 어떤 분포에 대해 이야기하고 있으며 차단 된 곳을 보여줍니다.
Frank

자세한 설명 감사합니다! 나는 또 다른 아이디어를 가지고 있었다 : 삼각형 분포로 수렴하는 함수 계열을 찾을 수 있지만 부분적으로는 할 수 없다고 가정 해보십시오 .MLE을 분석적으로 도출하기 위해 사용할 수 있습니까? 제한을 취하고 삼각형 분포 자체?
Frank

아마도-사용하는 특정 제한 프로세스에 따라 달라질 수 있다고 생각합니다 ... 여러 지역의 최대 값으로 끝날 수 있으므로 극단적 인 주문 통계 근처의 가능성을 평가할 수는 있지만 어쨌든 왜 그렇게 복잡한 일을하려고합니까? 삼각 분포에서 ML의 문제점은 무엇입니까? 실제로는 매우 간단합니다.
Glen_b-복지 주 모니카

2
위의 장에서 파생 된 작업은 약간의 작업이 필요하지만 (물론 어렵지는 않지만) MLE의 본질이 argmax에 있음을 보여주는 좋은 예입니다. 파생 상품이 아니라 (당신이 지적했듯이, 나는 완전히 동의 한 것처럼, 나는 "일반적인"파생 단계의 업스트림에서 일하는 것이 일어났다 (즉, 어떤 방법 으로든 최대화하는 것에 대해 걱정하지만, 나는 추구하지 않았다).
Frank

1
엑스나는
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.