Johnson-Lindenstrauss의 정리는 고차원 공간의 점들을 저 차원의 점들로 나타낼 수있게합니다. 가장 적합한 저 차원 공간을 찾을 때 표준 기법은 특이 값 분해를 찾은 다음 가장 큰 특이 값으로 생성 된 부분 공간을 취하는 것입니다. SVD에 Johnson-Lindenstrauss를 사용하는 것이 언제 중요합니까?
Johnson-Lindenstrauss의 정리는 고차원 공간의 점들을 저 차원의 점들로 나타낼 수있게합니다. 가장 적합한 저 차원 공간을 찾을 때 표준 기법은 특이 값 분해를 찾은 다음 가장 큰 특이 값으로 생성 된 부분 공간을 취하는 것입니다. SVD에 Johnson-Lindenstrauss를 사용하는 것이 언제 중요합니까?
답변:
두 가지 접근 방식은 매우 다른 보증을 제공합니다.
JL Lemma는 본질적으로 "당신이 원하는 오류를 주며, 그 오류까지의 거리를 포착하는 저 차원 공간을 줄 것"이라고 말합니다. 또한 최악의 페어 와이즈 보증입니다 : 각 포인트 쌍 등
SVD는 본질적으로 "어떤 차원에 살고 싶은지 말해 주겠다. 그리고 가능한 최선의 임베딩을 제공 할 것이다". 여기서 "best"는 평균으로 정의된다 : 진정한 유사성 대 예상 유사성의 총 오차는 최소이다.
따라서 이론적 인 관점에서 그들은 매우 다른 문제를 해결합니다. 실제로, 원하는 것은 문제의 모델, 더 중요한 매개 변수 (오류 또는 차원) 및 필요한 보증 종류에 따라 다릅니다.
SVD와 JL은 미래의 포인트에 대해서도 다르게 추정합니다.
즉, 데이터가 일부 기본 분포에서 나온 것으로 가정하면 원칙적으로 SVD는 동일한 분포에서 표본 추출되는 한 미래의 포인트에 대해 "양호"상태를 유지해야합니다. 반면, JL의 대상 차원은 포인트 수에 따라 달라집니다. 즉, 추가 포인트에 JL 변환을 적용하면 오류 확률이 높아질 수 있습니다.
예를 들어 차원 축소를 다른 알고리즘의 전처리 단계로 사용하는 경우에는 관련이 있습니다. 훈련 데이터에 대한 SVD 경계는 테스트 데이터를 유지할 수 있지만 JL은 그렇지 않습니다.
이것은 Suresh의 답변에 대한 후속 조치입니다. 나는 그의 답변을 읽은 후에 약간 구글을 보았고 다음과 같은 이해를 얻었습니다. 나는 원래 그의 답변에 대한 의견으로 이것을 게시하려고했지만 계속 증가했습니다.
답변에서 오류를 지적하십시오.이 분야의 전문가는 아닙니다.
어떤 의미에서 JL과 SVD는 사과와 오렌지와 같습니다.
1) 그들이 해결하는 문제는 완전히 다릅니다. 하나는 쌍 거리에 관한 것이고 다른 하나는 가장 잘 표현 된 것입니다. 하나는 최악의 경우이고 다른 하나는 평균 경우입니다.
서브 스페이스의 JL 반환 (JL은 건설 아니지만, 그것이 가장 좋은 부분 공간 반환 가정 할 수 있습니다) 다음과 같은 최적화의 해결책이
(이것은 정확하지 않습니다, 나중에 이것에 대해 더 언급 할 것입니다)
SVD가 해결하는 문제는 (치수 )
2) 입력 : 두 알고리즘 모두 부분 공간을 출력하지만 필요한 입력은 다릅니다. JL에는 공차 (실제 거리와 부분 공간의 거리를 용인하려는 최대 오류는 얼마입니까)이 필요하지만 SVD에는 차원 수가 필요합니다.
3) JL은 비 구조적이며 SVD는 구성 적입니다.이 용어는 건설적인 용어가 정확하게 정의되지 않았기 때문에 약간 모호합니다. SVD를 계산하는 결정 론적 알고리즘이 있지만 JL 공간을 찾는 알고리즘은 무작위로 만들어집니다. 실패하면 무작위 투영을 수행하고 다시 시도하십시오.
4) SVD는 고유합니다 (서브 스페이스는 고유하지 않을 수 있지만 목표 값은 모든 서브 스페이스에 대해 동일합니다). 위의 식 (1)은 JL이 실제로 쌍 단위 거리의 불일치를 최소화하는 것에 대해 이야기하지 않는다는 점에서 정확하지 않습니다. 거리가 실제 과 거의 다를 수있는 더 작은 부분 공간의 존재를 보장합니다 가치. 이러한 하위 공간이 많을 수 있으며 일부는 다른 것보다 낫습니다.
(답변의 파업 부분에 대한 설명은 주석을 참조하십시오).
편집 : @ john-myles-white는 JL에 대한 주장을 확인하고 투영을 구성하는 방법을 보여주기 위해 게시물을 작성했습니다 : http://www.johnmyleswhite.com/notebook/2014/03/24/a-note- 존슨 린든 스트라우스-엘레 마 /