50 차원 하이퍼 큐브가 있다면. 그리고 경계를 또는 0.95 < x j < 1로 정의합니다. 여기서 x j 는 하이퍼 큐브의 차원입니다. 그런 다음 하이퍼 큐브의 경계에서 점의 비율을 계산하는 것은 0.995 입니다. 무슨 뜻이에요? 나머지 공간이 비어 있다는 의미입니까? 경우 (99) % 포인트의이 경계에있는 다음 큐브 안에 포인트가 균일하게 분포되지해야합니까?
50 차원 하이퍼 큐브가 있다면. 그리고 경계를 또는 0.95 < x j < 1로 정의합니다. 여기서 x j 는 하이퍼 큐브의 차원입니다. 그런 다음 하이퍼 큐브의 경계에서 점의 비율을 계산하는 것은 0.995 입니다. 무슨 뜻이에요? 나머지 공간이 비어 있다는 의미입니까? 경우 (99) % 포인트의이 경계에있는 다음 큐브 안에 포인트가 균일하게 분포되지해야합니까?
답변:
하이퍼 큐브에 무한히 많은 포인트가 포함되어 있기 때문에 ' 하이 큐브에서 포인트 의 '라고 말하는 것은 약간 잘못된 것입니다. 대신 볼륨에 대해 이야기합시다.
하이퍼 큐브의 부피는 측면 길이의 곱입니다. 50 차원 단위 하이퍼 큐브의 경우
이제 하이퍼 큐브의 경계를 배제하고 ' 내부 '를 봅시다 ( 내부 수학 용어 는 매우 다른 의미를 갖기 때문에 따옴표 안에 넣습니다 ). 우리는 0.05 < x 1 < 0.95 를 만족
하는 점 만 유지합니다
이는 50 차원 하이퍼 큐브 부피의 가 ' 경계 ' 에 집중되어 있음을 보여줍니다 .
후속 조치 : 이그나티우스 는 이것이 어떻게 확률과 관련이 있는지에 대한 흥미로운 질문을 제기했습니다. 다음은 예입니다.
50 개의 입력 매개 변수를 기반으로 주택 가격을 예측하는 (머신 러닝) 모델을 생각해 봅시다. 모든 50 개의 입력 매개 변수는 독립적 이며 0 과 1 사이에서 균일하게 분배 됩니다.
경험 법칙 : 높은 차원에서 극단적 인 관찰은 예외가 아닌 규칙입니다.
더 작은 치수에서도 패턴을 명확하게 볼 수 있습니다.
1 차원. 길이 10의 선과 1의 경계를 선택합니다. 경계의 길이는 2이고 내부는 8, 1 : 4 비율입니다.
2 차원. 측면 10의 제곱과 경계 1을 다시 가져옵니다. 경계의 면적은 36, 내부 64, 9:16 비율입니다.
3 차원. 동일한 길이와 경계. 경계의 부피는 488이고 내부는 512, 61:64입니다. 이미 경계는 내부와 거의 같은 공간을 차지합니다.
4 차원, 이제 경계는 5904이고 내부는 4096입니다-이제 경계가 더 큽니다.
더 작고 더 작은 경계 길이에서도 치수가 증가함에 따라 경계 체적이 항상 내부를 추월합니다.
그것을 이해하는 가장 좋은 방법은 (인간에게는 IMHO 불가능하지만) n- 차원 공과 n- 차원 큐브의 부피를 비교하는 것입니다. n (치수)의 증가로 볼의 모든 부피가 "누설"되어 큐브의 모서리에 집중됩니다. 이것은 코딩 이론과 그 응용에서 기억해야 할 유용한 일반 원칙입니다.
이에 대한 가장 좋은 교과서 설명은 Richard W. Hamming의 저서 "코딩 및 정보 이론"(3.6 Geometric Approach, p 44)에 있습니다.
Wikipedia 의 짧은 기사 는 n 차원 단위 큐브의 양이 항상 1 ^ n임을 명심하면 동일한 내용을 간략하게 요약합니다.
도움이 되길 바랍니다.