미분 추정을위한 최적의 대역폭은 밀도 추정을위한 대역폭과 다릅니다. 일반적으로 밀도의 모든 기능에는 고유 한 최적의 대역폭 선택기가 있습니다.
목표가 평균 적분 제곱 오차 (일반적인 기준)를 최소화하는 것이라면 주관적인 것이 없습니다. 기준을 최소화하는 값을 도출하는 것이 중요합니다. 방정식은 Hansen (2009) 의 섹션 2.10에 나와 있습니다.
까다로운 부분은 최적 대역폭이 밀도 자체의 함수이므로이 솔루션은 직접적으로 유용하지 않다는 것입니다. 이 문제를 해결하기 위해 여러 가지 방법이 있습니다. 이들은 보통 정규 근사를 사용하여 밀도의 일부 기능에 근사합니다. 밀도 자체가 정상이라는 가정은 없습니다. 가정은 밀도를 가정하면 정규성을 가정하여 밀도의 일부 기능을 얻을 수 있다는 것입니다.
근사치가 부과되는 위치에 따라 대역폭 선택기가 얼마나 좋은지 결정됩니다. 가장 조잡한 접근 방식을 "정상 참조 규칙"이라고하며 근사치를 높은 수준으로 적용합니다. Hansen (2009)의 섹션 2.10의 끝은이 접근법을 사용한 공식을 제공합니다. 이 접근 방식은 CRAN hns()
의 ks
패키지에서 기능 으로 구현됩니다 . 자신의 코드를 작성하지 않으려는 경우 아마도 가장 좋습니다. 따라서 다음과 같이 밀도의 미분을 추정 할 수 있습니다 (을 사용하여 ks
).
library(ks)
h <- hns(x,deriv.order=1)
den <- kdde(x, h=h, deriv.order=1)
일반적으로 "직접 플러그 인"선택기로 알려진 더 나은 접근 방식은 더 낮은 수준에서 근사치를 부과합니다. 직선 밀도 추정의 경우, 이는을 사용하여 R로 구현 된 Sheather-Jones 방법 density(x,bw="SJ")
입니다. 그러나 파생 상품 추정을 위해 R 패키지에 유사한 시설이 있다고 생각하지 않습니다.
직접 커널 추정을 사용하는 대신 로컬 다항식 추정기로 더 나은 결과를 얻을 수 있습니다. 이는 R locpoly()
의 ks
패키지 기능을 사용하여 수행 할 수 있습니다 . 다시, 최적의 대역폭 선택이 구현되지 않았지만 바이어스는 커널 추정기보다 작습니다. 예를 들어
den2 <- locpoly(x, bandwidth=?, drv=1) # Need to guess a sensible bandwidth