7
유클리드 거리는 일반적으로 희소 데이터에 적합하지 않습니까?
나는 우리가 다차원적이고 희소 한 데이터를 가질 때 고전적인 거리 (유클리드 거리와 같은)가 약하게 구별되는 곳을 보았다. 왜? 유클리드 거리가 잘 수행되지 않는 두 개의 희소 데이터 벡터의 예가 있습니까? 이 경우 어떤 유사성을 사용해야합니까?
희소 행렬은 많은 요소가 0 인 행렬입니다. 이 태그는 희소성이있는 회귀 모델 또는 "희소성에 대한 베팅"원칙과 같은 다른 컨텍스트에서 희소성에 사용할 수도 있습니다.