이것은 차원의 저주를 언급 할 때 자주 인용되며
(상대 대비라고하는 오른쪽 공식)
정리 결과는 주어진 쿼리 지점까지의 최대 거리와 최소 거리의 차이가 고차원 공간에서 어떤 지점까지의 가장 가까운 거리만큼 빠르게 증가하지 않음을 보여줍니다. 가장 가까운 이웃과 가장 가까운 이웃 사이의 식별이 좋지 않기 때문에 근접성 쿼리는 의미가없고 불안정합니다.
그러나 실제로 샘플 값에 대한 상대 대비를 계산하려고하면 매우 작은 값을 포함하는 벡터를 가져 와서 제로 벡터까지의 거리를 계산하고 훨씬 더 큰 값을 포함하는 벡터에 대해서도 동일하게 수행합니다. 3의 차원과 배 더 큰 차원에서 , 비율이 감소하는 동안 실제로 실제로 사용 된 차원의 수와 무관하게 변화가 너무 작다는 것을 알 수 있습니다. Graham의 수 의 크기가있는 데이터 크기 -종이가 실제로 관련이 있다고 설명하는 효과에 필요한 크기라고 생각합니다.)
앞에서 언급 한 바와 같이,이 정리는 유클리드 공간을 기반으로 근접성을 측정하는 것이 고차원 공간에서 좋지 않은 전략이라는 주장을지지하기 위해 자주 인용됩니다. 저자들은 그렇게 말합니다. 이 정리는 잘못된 방식으로 사용되었다고 생각합니다.
예 : d
치수
a=np.ones((d,)) / 1e5
b=np.ones((d,)) * 1e5
dmin,dmax=norm(a), norm(b)
(dmax-dmin)/dmin
d = 3의
9999999999.0
경우 d = 1e8의 경우
9999999998.9996738
d = 1e8의
경우 d = 3 인
99.0
경우 1e5 대신 1e1 (데이터가 정규화 되었다고 가정)
98.999999999989527