연속 랜덤 변수에 대해 이야기하고 있다고 지정하지는 않지만 KDE를 언급했기 때문에 이것을 의도한다고 가정합니다.
부드러운 밀도를 맞추는 두 가지 다른 방법 :
1) 로그 스플라인 밀도 추정. 여기에서 스플라인 곡선이 로그 밀도에 맞춰집니다.
예시 논문 :
Kooperberg and Stone (1991),
"로그 스플라인 밀도 추정에 관한 연구"
전산 통계 및 데이터 분석 , 12 , 327-347
Kooperberg 그의 논문의 PDF 파일에 대한 링크를 제공 여기를 "1991"에서,.
R을 사용한다면 이것에 대한 패키지 가 있습니다. 그것에 의해 생성 된 적합의 예는 여기에 있습니다 . 다음은 거기에있는 데이터 세트의 로그에 대한 히스토그램과 답변에서 로그 스플라인 및 커널 밀도 추정값을 재현 한 것입니다.
로그 스플라인 밀도 추정치 :
커널 밀도 추정치 :
2) 유한 혼합물 모델 . 여기서 편리한 분포 군이 선택되고 (대부분의 경우 정규 분포) 밀도는 해당 계열의 여러 다른 구성원이 혼합 된 것으로 가정합니다. 커널 밀도 추정값은 이러한 혼합으로 볼 수 있습니다 (가우시안 커널에서는 가우시안 혼합).
보다 일반적으로 ML 또는 EM 알고리즘을 통해, 또는 경우에 따라 모멘트 매칭을 통해 적합 할 수 있지만, 다른 상황에서는 다른 접근법이 가능할 수 있습니다.
(다양한 형태의 혼합물 모델링을 수행하는 수많은 R 패키지가 있습니다.)
편집에 추가됨 :
3) 평균적으로 이동 된 히스토그램
(말 그대로 부드럽 지 않지만 미지정 된 기준에 대해 충분히 부드럽습니다) :
매번 정수 대해 만큼 이동 한 다음 평균화 되는 bin-origin을 가로 질러 일정한 고정 폭 ( ) 에서 히스토그램 시퀀스를 계산한다고 상상해보십시오 . 이것은 binwidth 에서 수행 된 히스토그램과 비슷 하지만 훨씬 매끄 럽습니다.bb/kkb/k
예를 들어, 이진 폭 1에서 각각 4 개의 히스토그램을 계산하지만 + 0, + 0.25, + 0.5, + 0.75만큼 오프셋 된 다음 주어진 에서 높이를 평균화합니다 . 당신은 다음과 같이 끝납니다 :x
이 답변 에서 가져온 다이어그램 . 내가 말했듯이, 당신이 그 수준의 노력으로 가면 커널 밀도 추정도 할 수 있습니다.