당신의 주요 관심사가 2 차원 문제라면, 커널 밀도 추정은 좋은 비 점프 적 특성을 가지고 있기 때문에 좋은 선택이라고 말할 것입니다 (최고라고 말하지는 않습니다). 예를 들어보십시오
Parzen, E. (1962). 확률 밀도 함수 및 모드 추정시 . 수학 통계 연보 33 : 1065–1076.
de Valpine, P. (2004). 가중 후방 커널 밀도 추정에 의한 몬테카를로 주 공간 가능성 . 미국 통계 협회의 전표 99 : 523-536.
더 높은 차원 (4+)의 경우,이 방법은 최적 대역폭 매트릭스를 추정하는 데 잘 알려진 어려움으로 인해 실제로 느리다 ( 참조) .
이제 ks
패키지 에서 명령의 문제점 KDE
은 언급했듯이 특정 그리드의 밀도를 평가하는 데 매우 제한적입니다. KDE
예를 들어 대역폭 매트릭스 추정 패키지 를 사용 Hscv
하여 커널 밀도 추정기를 구현 한 다음 명령을 사용하여이 기능을 최적화하면 이 문제를 해결할 수 있습니다 optim
. 아래의 시뮬레이션 된 데이터와 가우스 커널을 사용하여 아래에 표시됩니다 R
.
rm(list=ls())
# Required packages
library(mvtnorm)
library(ks)
# simulated data
set.seed(1)
dat = rmvnorm(1000,c(0,0),diag(2))
# Bandwidth matrix
H.scv=Hlscv(dat)
# [Implementation of the KDE](http://en.wikipedia.org/wiki/Kernel_density_estimation)
H.eig = eigen(H.scv)
H.sqrt = H.eig$vectors %*% diag(sqrt(H.eig$values)) %*% solve(H.eig$vectors)
H = solve(H.sqrt)
dH = det(H.scv)
Gkde = function(par){
return( -log(mean(dmvnorm(t(H%*%t(par-dat)),rep(0,2),diag(2),log=FALSE)/sqrt(dH))))
}
# Optimisation
Max = optim(c(0,0),Gkde)$par
Max
예를 들어, 모양이 제한된 추정기는 더 빠른 경향이 있습니다.
Cule, ML, Samworth, RJ 및 Stewart, MI (2010). 다차원 로그 오목 밀도의 최대 가능성 추정 . 왕립 통계 학회지 B 72 : 545–600.
그러나이 목적으로 는 너무 정점 에 달 했습니다.
4
다변량 유한 법선의 혼합 (또는 다른 유연한 분포) 피팅 또는
Abraham, C., Biau, G. 및 Cadre, B. (2003). 다변량 밀도 모드의 간단한 추정 . 캐나다 통계 저널 31 : 23-34.
이게 도움이 되길 바란다.