N 차원에서 가중치 포인트 세트 (즉, 각 샘플이 필요하지 않은 가중치를 가짐)로 일부 커널 밀도 추정을 수행하고 있습니다. 또한 이러한 샘플은 미터법 공간에 있습니다 (즉, 샘플 간 거리를 정의 할 수 있음). 예를 들어, 샘플 포인트의 평균, 표준 편차 또는 다른 변수와 비교하여 하나의 변수를 스케일 할 수 없습니다. 커널은이 거리와 각 샘플의 무게에 영향을받습니다 :
이와 관련하여, 나는 공간적으로 변할 수 있고 바람직하게는 훈련 데이터 세트 에 대한 정확한 재구성을 제공하는 커널 대역폭 대한 강력한 추정을 찾으려고 노력하고있다 . 필요한 경우 함수가 비교적 부드럽다 고 가정 할 수 있습니다.
가장 가까운 첫 번째 또는 두 번째 이웃까지의 거리를 사용해 보았지만 결과가 매우 좋지 않습니다. Leave-One-Out 최적화를 시도했지만 Nd 의이 맥락에서 최적화 할 수있는 좋은 척도를 찾는 데 어려움이 있으므로 특히 훈련 샘플 자체에 대한 매우 나쁜 추정치를 찾습니다. 표준 편차를 계산할 수 없기 때문에 정상적인 가정을 기반으로 욕심 많은 추정치를 사용할 수 없습니다. 공분산 행렬을 사용하여 이방성 커널을 얻는 참조를 찾았지만 다시이 공간에는 들지 않습니다 ...
누군가 아이디어 나 참조가 있습니까?