스파이크가없는 잘린 가우스 곡선의 평균 및 표준 편차 추정


11

평균 m 및 표준 편차 s를 갖는 정규 분포에 따라 데이터를 생성하는 블랙 박스가 있다고 가정합니다. 그러나 값이 0보다 작은 값을 출력 할 때마다 아무 것도 기록하지 않는다고 가정하십시오 (이러한 값이 출력되었음을 알 수 없음). 급격한 가우시안 분포가 있습니다.

이 매개 변수를 어떻게 추정 할 수 있습니까?


대부분의 답변은 다른 배포판과 관련된 상황에서 잠재적으로 유용 할 수 있기 때문에 태그를 "절단 된 가우시안"에서 "잘림"으로 변경했습니다.
whuber

답변:


7

데이터 모델은 다음과 같습니다.

yiN(μ,σ2)I(yi>0)

따라서 밀도 함수는 다음과 같습니다.

f(yi|)=exp((yiμ)22σ2)2πσ (1ϕ(μσ))

어디,

ϕ(.) 는 표준 일반 cdf입니다.

그런 다음 최대 우도 또는 베이지안 방법을 사용하여 및 매개 변수를 추정 할 수 있습니다 .μσ


3

Srikant Vadali가 제안했듯이, 코헨과 HALD는 (뉴튼 - 랩슨 루트 파인더) ML을 사용하여이 문제를 해결 1950 년 또 다른 용지로 볼 수 있습니다 최대 Halperin의 "잘린 정상 분포에서 추정"입니다 해결 JSTOR (액세스 할 수있는 사람들을 위해 참조). 인터넷 검색 "잘린 가우시안 추정"은 많은 유용한 조회수를 생성합니다.


세부 사항은이 질문을 일반화하는 스레드로 제공됩니다 (일반적으로 잘린 분포에). 잘린 분포에 대한 최대 우도 추정값을 참조하십시오 . 최대 우도 추정값을 R의 Max Entropy Solver에서 주어진 (코드와 함께) 최대 엔트로피 솔루션과 비교하는 것도 흥미로울 수 있습니다 .


2

기술적 경계 TB가 H. Schneider 의 단순화 된 접근 방식 은 잘린 정규 분포 의 평균 및 표준 편차 를 계산하는 데 매우 유용합니다 .a=0μtσt

  1. 데이터 세트 의 평균 및 표준 편차 (전체 모집단!)를 계산합니다.μσ

    μ=x¯=1ni=1nxi

    σ=s=1ni=1n(xix¯)2

  2. 기술 경계 이 평균 까지 유효한 거리인지 확인하십시오 .TB=a=0x¯

    고려한 경우에 필요하지 않다TB=ax¯3s

  3. 계산 및 :ω,P3(ω),P4(ω)Q(ω)

    ω=s2(ax¯)2

    P3(ω)=1+5,74050101ω13,53427037ω2+6,88665552ω3

    P4(ω)=0,00374615+0,17462558ω2,87168509ω2+17,48932655ω311,91716546ω4

    Q(ω)=P4(ω)P3(ω)

  4. 인지 확인하십시오 . 그렇지 않으면 평균 가 으로 기술적으로 유용하지 않습니다ω0,57081μt<0

  5. 잘린 정규 분포에 대해 및 를 계산하십시오 .μtσt

    μt=x¯+Q(ω)(ax¯)

    σt2=s2+Q(ω)(ax¯)2

그게 다야...

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.