기계 학습에서 유클리드 거리 에서 맨해튼 거리 를 사용하는 이유에 대한 좋은 논쟁을 찾고 있습니다.
내가 지금까지 좋은 논증을 찾은 가장 가까운 것은 이 MIT 강의 입니다.
36시 15 분에 슬라이드에서 다음 내용을 볼 수 있습니다.
"일반적으로 유클리드 메트릭을 사용 합니다. 다른 차원을 비교할 수없는 경우 Manhattan이 적합 할 수 있습니다. "
교수가 파충류의 다리 수가 0에서 4까지 변하기 때문에 (다른 기능은 이진이고 0에서 1까지만 변함) "다리의 수"기능은 훨씬 더 높아질 것이라고 유클리드 거리가 사용되는 경우 무게. 물론, 맞습니다. 그러나 맨해튼 거리를 사용하는 경우에도 문제가 있습니다 (유클리드 거리에서와 같이 차이를 제곱하지 않기 때문에 문제가 약간 완화되는 경우에만).
위의 문제를 해결하는 더 좋은 방법은 "다리 수"기능을 정규화하여 값이 항상 0과 1 사이가되도록하는 것입니다.
따라서 문제를 해결하는 더 좋은 방법이 있기 때문에 맨해튼 거리를 사용한다는 주장은 적어도 내 견해로는 더 강점이 부족한 것처럼 느껴졌습니다.
누군가가 언제 그리고 언제 누군가가 유클리드에서 맨해튼 거리를 사용할지 알고 있습니까? 누구든지 맨해튼 거리를 사용하면 더 나은 결과를 얻을 수있는 예를 들어 줄 수 있습니까?