첫 번째 k (임시) 모멘트를 사용하여 대략적인 PDF (예 : 밀도 추정)를 맞추는 방법은 무엇입니까?


11

데이터 세트의 (첫 번째) 순간을 추정 할 수 있고 밀도 함수의 추정을 생성하는 데 사용하려는 상황이 있습니다.k

나는 이미 Pearson 분포를 겪었 지만 처음 4 개 순간에만 의존한다는 것을 깨달았습니다 (가능한 순간 조합에 대한 제한이 있음).

또한 더 많은 가정을 사용하지 않을 때 유한 모멘트 집합이 특정 분포를 "막아 내기"에 충분하지 않다는 것을 이해합니다. 그러나 나는 여전히 더 일반적인 배포판 (Pearson 계열의 배포판 제외)을 원합니다. 다른 질문을 살펴보면 그러한 분포를 찾을 수 없었습니다 ( 여기 , 여기 , 여기 , 여기 , 여기 , 여기 참조 ).

모멘트 집합에 대해 정의 할 수있는 일반화 된 분포 군이 있습니까? (표준 정규 분포를 취할 수 있고 모든 k 모멘트 세트가 확인 될 때까지 변환 할 수있는 변환 세트 일 수 있음 )케이케이

(다른 모멘트가 0인지 아닌지에 대해서는 신경 쓰지 않습니다)k+1

감사.

추신 : 확장 된 예제에 대해 기뻐할 것입니다. 바람직하게는 R 코드 예와 함께.


2
첫 번째 모멘트 는 0에서 특성 함수 의 첫 번째 k 도함수를 정의합니다 : E [ X k ] = ( i ) k ϕ ( k ) X ( 0 ) . 따라서 특성 함수의 Taylor 확장의 첫 번째 k 항을 0으로 알고 있습니다. 그런 다음 반전 이론을 사용하여 밀도를 도출 할 수 있습니다. 케이케이이자형[엑스케이]=(나는)케이ϕ엑스(케이)(0)케이
Stephan Kolassa

감사합니다 @StephanKolassa-확장 된 답변 / R 코드 예제가 있습니까?
탈 Galili

2
en.wikipedia.org/wiki/Maximum_entropy_probability_distribution 은 일반적인 방법을 제안합니다.
whuber

친애하는 @ whuber, R 코드 예제를 제안 해 주시겠습니까? (또한, 이것은 늑대의 대답과 함께됩니까?)
Tal Galili

이것은 그 대답과 완전히 다른 접근법입니다.
whuber

답변:


11

방법 1 : 상위 Pearson 시스템

Pearson 시스템은 일반적으로 미분 방정식에 대한 솔루션 로 간주됩니다 .(엑스)

(엑스)엑스=(+엑스)0+1엑스+2엑스2(엑스)

여기서 4 개의 Pearson 매개 변수 는 모집단의 처음 네 모멘트로 표현 될 수 있습니다.(,0,1,2)

Pearson 시스템을 2 차 c 0 + 에 두는 대신0+1엑스+2엑스2(엑스)

(엑스)엑스=(+엑스)0+1엑스+2엑스2+엑스(엑스)

솔루션이 생성됩니다.

여기에 이미지 설명을 입력하십시오

나는 이것을 재미있게 해결했다. (OP와 같은 생각을 가지게 되었음) : 도출과 해결책은 우리 책 5 장에 나와있다. 관심이 있으시면 여기에서 무료로 다운로드 할 수 있습니다.

http://www.mathstatica.com/book/bookcontents.html

2 차 (2 차) 피어슨 패밀리는 처음 4 개의 모멘트로 표현 될 수 있지만 3 차 (큐빅) 피어슨 스타일의 패밀리는 처음 6 개의 모멘트가 필요합니다.

방법 2 : 그램-차 일러 확장

케이h

인구 모멘트 또는 표본 모멘트 ??

Pearson 스타일 시스템의 경우 : 모집단의 모멘트를 알고있는 경우 더 높은 모멘트를 사용하면 더 잘 맞을 수 있습니다. 그러나 관측 된 데이터가 모집단에서 추출한 무작위 표본 인 경우, 트레이드 오프가 발생합니다. 고차 다항식은 고차 모멘트가 필요하다는 것을 의미하며 후자의 추정값은 신뢰할 수 없을 수 있습니다 (고 분산). 표본 크기가 '큰'이 아닌 한. 다시 말해, 표본 데이터가 주어지면, 더 높은 모멘트를 사용하는 피팅은 '불안정'해져서 결과가 떨어질 수 있습니다. Gram-Charlier 확장의 경우에도 마찬가지입니다. 추가 용어를 추가하면 실제로 더 적합하지 않을 수 있으므로 약간의주의가 필요합니다.


친애하는 @wolfies-답변 주셔서 감사합니다! 내가 당신을 올바르게 이해한다면, Gram-Charlier 확장은 내가 찾고있는 것과 더 일치합니다 (더 일반화 된 Pearson 분포가 흥미로울지라도). 나는 당신의 책을 보았고 (175 장에서 시작하는 5 장), 실제로 당신이 자세한 설명을하는 것을 보았습니다. (추정 된 순간을 다루는 방법에 대한 언급도 있습니다.) 유일한 것은 코드를 사용할 수 없다는 것입니다 (R 사용자이므로). 귀하의 답변 (그리고 일반적으로 인상적이고 흥미로워 보이는 책)에 감사드립니다
Tal Galili

2
: 그냥 다양한 방법으로 처리 할 수있는 R 패키지 발견 cran.us.r-project.org/web/packages/PDQutils/vignettes/...
탈 Galili 한
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.