적응 형 커널 밀도 추정기?


12

누구나 적응 형 커널 밀도 추정기 사용 경험을보고 할 수 있습니까?
(적응 형 | 가변 | 가변 폭, KDE | 히스토그램 | 보간 기 등의 동의어가 많이 있습니다.)

가변 커널 밀도 추정에 따르면 "샘플 공간의 다른 영역에서 커널의 너비를 변경합니다. 실제로는 두 가지 방법이 있습니다." multigrid ...
물론 단일 방법으로 모든 것을 수행 할 수는 없지만 적응 형 방법은 매력적으로 보입니다.
예를 들어 유한 요소 방법 의 적응 형 2D 메쉬의 멋진 그림을 참조하십시오 .

실제 데이터에서 작동하지 않았거나 작동하지 않는 것, 특히 2D 또는 3D에서 100K 이상 흩어져있는 데이터 포인트를 듣고 싶습니다.

11 월 2 일 추가 : 여기에는 "덩어리"밀도 (개별 x ^ 2 * y ^ 2), 가장 가까운 이웃 추정치 및 Scott의 계수를 가진 가우스 KDE의 도표가 있습니다. 하나의 예는 아무것도 입증하지 않지만 NN이 날카로운 언덕에 합리적으로 잘 맞을 수 있음을 보여줍니다 (그리고 KD 나무를 사용하면 2d, 3d는 빠릅니다 ...) 대체 텍스트


"작동하는"또는 프로젝트의 특정 목표가 의미하는 바에 대해 좀 더 많은 맥락을 제시 할 수 있습니까? 공간 점 프로세스를 시각화하는 데 사용했지만이 질문을 할 때 이것이 염두에 두었습니다.
Andy W

답변:


7

n450np4p 가변 커널 방법이 고정 폭과 경쟁하는 설정 (크기에 따라 다릅니다)은 귀하의 질문에 따라이 설정에 있지 않습니다.

이 결과의 직관은 매우 드문 설정이 아닌 경우 로컬 밀도가 효율 손실을 능가하기 위해 바이어스 게인이 충분히 변하지 않기 때문에 가변 폭 커널의 AMISE가 고정 폭의 AMISE). 또한 샘플 크기가 크거나 크기가 작을 경우 고정 폭 커널은 이미 매우 국지적이므로 바이어스 측면에서 잠재적 인 이득을 줄입니다.


고마워 곽. "... 가우스 분포 랜덤 변수의 경우"; "덩어리"분포에 대한 새로운 작업에 대해 알고 있습니까?
데니스

@Denis :> 'Clumpy'=? concentrated =? 가우스보다 꼬리가 좁습니까?
user603

난 전문가는 아니지만, 종이에 "데이터 세트 clumpiness"랭 외, "빠른 커널 밀도 추정 알고리즘에 대한 통찰력"2004 년, 8P있다.
데니스

@Denis :> 문제가 최악이라고 말합니다 (즉, NN 커널은 덜 덩어리는 데이터에서 더 잘 작동해야합니다). 나는 직관적 인 설명을 가지고 있지만 여기에 맞지 않을 것입니다. 또한 추가 의견을 얻기 위해 메인 보드 에서이 질문을 별도의 질문 (이 질문에 연결)으로 요청할 수 있습니다.
user603


-1

Loess / lowess는 기본적으로 변수 KDE 방법으로, 커널 너비는 가장 가까운 이웃 접근 방식으로 설정됩니다. 데이터 포인트의 밀도가 크게 변할 때 고정 너비 모델보다 훨씬 잘 작동한다는 것을 알았습니다.

KDE 및 다차원 데이터에 대해 알아야 할 한 가지는 차원의 저주입니다. 다른 것들이 같으면 p ~ 2 일 때보 다 p ~ 10 일 때 설정된 반경 내에 훨씬 적은 점이 있습니다. 이것은 3D 데이터 만 가지고 있다면 문제가되지 않지만 명심해야 할 것입니다.


3
Loess는 가변 커널 REGRESSION 방법입니다. 이 질문은 가변 커널 밀도 추정에 관한 질문이었습니다.
Rob Hyndman

죄송합니다. 질문을 오해하십시오.
Hong Ooi

@Rob, 내 순진한 질문을 용서하십시오. 다양한 커널 너비가 로컬 회귀 / 커널 스무딩에 좋은 경우가 있는데 왜 밀도 추정에 나쁜가요? 밀도 추정은 f () == density ()에 대한 f () 추정의 경우가 아닙니까?
데니스

@ Hong Ooi, Ndim이 사용한 점은 몇 점입니까? 감사합니다
데니스

@ 데니스. 좋은 질문입니다. 사이트에 적절한 질문으로 추가해 주시면 사람들이 어떤 답변을 얻을 수 있는지 확인할 수 있습니다.
Rob Hyndman
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.