1999 년 Beyer et al. 물었다 가 "가장 가까운 이웃"의미가?
1999 년 이후 NN 검색에서 거리 편평의 영향을 분석하고 시각화하는 더 좋은 방법이 있습니까?
[주어진] 데이터 세트가 1-NN 문제에 대한 의미있는 답변을 제공합니까? 10-NN 문제? 100-NN 문제?
오늘날 전문가들이이 질문에 어떻게 접근 하시겠습니까?
월요일 1 월 24 일 수정 :
"차원이 증가함에 따라 거리 평탄도"의 짧은 이름으로 "거리 화이트 아웃"은 어떻습니까?
"거리 화이트 아웃"을 쉽게 볼 수있는 방법은 2-NN을 실행하고 가장 가까운 이웃 및 두 번째 이웃 이웃까지의 거리를 플로팅하는 것입니다. 아래 그림은 Monte Carlo의 다양한 nclusters 및 치수에 대한 dist 1 및 dist 2 를 보여줍니다 . 이 예는 스케일링 된 절대 차이 | dist 2 -dist 1 |에 대한 아주 좋은 거리 대비를 보여줍니다 . ( 치수 → ∞와의 상대적인 차이 | dist 2 / dist 1 | → 1이므로 쓸모 없게됩니다.)
주어진 상황에서 절대 오차 또는 상대 오차를 사용해야하는지 여부는 "실제"소음에 따라 달라집니다.
제안 : 항상 2-NN을 실행하십시오. 2 명의 이웃은 가까이있을 때는 유용하고 그렇지 않을 때는 유용합니다.