비대칭 분포에 대한 커널 밀도 추정


10

보자{엑스1,,엑스} 관측 알 수없는 (그러나 확실히 비대칭) 확률 분포에서 얻을 수.

KDE 접근법을 사용하여 확률 분포를 찾고 싶습니다. 그러나 가우시안 커널을 사용하려고했지만 대칭이기 때문에 성능이 . 따라서 감마 및 베타 커널에 대한 일부 작업이 릴리스되었지만 작동 방법을 이해하지 못했습니다.

에프^(엑스)=1h나는=1케이(엑스엑스나는h)

내 질문은 : 기본 분포의 지원이 구간에없는 것을 가정하여,이 비대칭 사건을 처리하는 방법 ?[0,1]


4
로그 노멀에 가까운 밀도 (일부 특정 응용 프로그램에서 많이 발생)의 경우 간단히 로그를 가져 와서 KDE를 수행 한 다음 KDE를 다시 변환합니다 (변환 할 때 Jacobian을 기억해야 함) 다시 견적). 이 경우 꽤 잘 작동합니다.
Glen_b-복지 주 모니카

@Glen_b이 방법이 설명 된 자료 나 자료가 있습니까? (원래 변수의 변환에서 KDE를 계산 한 다음 KDE를 다시 변환)
boscovich

내가 아는 바는 없다-그것들은 다소 사소한 아이디어이고 쉽게 구현되기 때문에 그것들이 존재한다고 확신한다. 통계가 저평가 될 수있을 것으로 기대하는 그런 종류의 것입니다. 실제로 그것은 매우 잘 작동합니다.
Glen_b-복지국 모니카

@glen_b 감사합니다. 따라서 기술 보고서 ​​/ 게시물에서 사용한다면 참조를하지 않아도된다고 생각하십니까?
boscovich

1
@guy 특히 일부 변환 및 일부 종류의 데이터에 문제가있을 수 있습니다. 내가 사용한 상황은 대수 정상과 매우 가까운 경향이 있으며, 문제로 보이는 대역폭의 변화는 정확히 필요한 것입니다. 원시 데이터보다 KDE보다 훨씬 낫습니다. OP의 설명에서 그것은 꽤 비슷하게 들렸지 만 그것이 만병 통치약 이라고 제안하고있는 것은 아닙니다 .
Glen_b-복지 모니카

답변:


5

우선, 대칭 커널을 사용하는 KDE는 데이터가 비대칭 일 때 매우 잘 작동 할 수 있습니다. 그렇지 않으면 실제로는 실제로 쓸모가 없습니다.

둘째, 이것이 문제의 원인이라고 생각되는 경우 비대칭 성을 수정하기 위해 데이터의 크기를 조정하는 것을 고려한 적이 있습니다. 예를 들어, 많은 문제를 해결하는 것으로 알려진 이동하는 것이 좋습니다 .로그(엑스)


로 스케일을 조정 log(x)하면 자 코비안을 설명해야합니까?
DilithiumMatrix

0

흠. 위치의 함수로 변경되는 커널 너비를 원할 수 있습니다.

eCDF에서 문제를보고 있다면 CDF의 숫자 기울기를 커널 크기와 관련 시키려고 할 수 있습니다.

좌표 변환을 수행하려면 시작점과 끝점을 잘 알고 있어야한다고 생각합니다. 목표 분포를 잘 알고 있다면 커널 근사값이 필요하지 않습니다.


1
RV가 음이 아니지만 KDE를 원한다는 것을 쉽게 알 수 있습니다.
guy
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.