다음과 같은 수학적 관계가 있습니까?
계산을 시도했지만 간단하고 흥미로운 링크 (식)에 도달 할 수 없었습니다. 나는 그것이 있는지 궁금합니다.
예를 들어, 각도는 비 균일 스케일링에서 유지되지 않지만 원래 각도와 비 균일 스케일링 후 각도 사이의 관계는 무엇입니까? 벡터 세트 S1과 다른 세트의 벡터 S2 사이의 링크에 대해 무엇을 말할 수 있습니까?
다음과 같은 수학적 관계가 있습니까?
계산을 시도했지만 간단하고 흥미로운 링크 (식)에 도달 할 수 없었습니다. 나는 그것이 있는지 궁금합니다.
예를 들어, 각도는 비 균일 스케일링에서 유지되지 않지만 원래 각도와 비 균일 스케일링 후 각도 사이의 관계는 무엇입니까? 벡터 세트 S1과 다른 세트의 벡터 S2 사이의 링크에 대해 무엇을 말할 수 있습니까?
답변:
때문에 매우 일반적이며 코사인 유사성의 변화는 과 그리고 그들의 관계 명확한 공식은 없습니다. 그러나 코사인 유사성이 얼마나 많이 변할 수 있는지에 대한 실질적으로 계산 가능한 한계가 있습니다 . 그들은 사이의 각도를 극단화하여 찾을 수 있습니다 과 주어진 사이의 코사인 유사성 과 지정된 값입니다. (어디 사이의 각도 과 ). 대답은 어느 각도인지 알려줍니다 변형에 의해 구부러 질 수 있음 .
계산이 지저분해질 위험이 있습니다. 일부 간단한 단순화와 함께 일부 영리한 표기법 선택으로 인해 노력이 줄어 듭니다. 그것은 밝혀 2 차원의 해결책이 우리가 알아야 할 모든 것을 알 수있다. 하나의 실제 변수에 따라 다루기 힘든 문제입니다.미적분 기법을 사용하여 쉽게 해결됩니다. 간단한 기하학적 인수는이 솔루션을 여러 차원으로 확장합니다.
정의에 따르면 두 벡터 사이의 각도의 코사인 과 단위 길이로 정규화하고 제품을 가져 와서 얻을 수 있습니다. 그러므로,
그리고, 쓰기 의 이미지 사이의 각도의 코사인 과 변형 아래 이다
오직 분석의 문제가 아니라그 자체. 따라서 우리는 SVD (Singular Value Decomposition) 를 활용할 수 있습니다.문제를 단순화합니다. 이것이 표현한다는 것을 기억하십시오 직교 행렬의 곱 (오른쪽에서 왼쪽으로) 대각 행렬 , 그리고 다른 직교 행렬 :
다시 말해서, 특권 벡터의 기초가 있습니다 (의 열 ) 각각의 크기를 조정하여 작동 에 의해 별도로 대각선 입구 (내가 전화 할 것이다 ) 이후 회전 (또는 회전 방지)을 적용합니다. 결과에. 최종 회전은 길이나 각도를 변경하지 않으므로 영향을 미치지 않아야합니다.. 계산을 통해 공식적으로 볼 수 있습니다
결과적으로 연구 우리는 자유롭게 바꿀 수 있습니다 동일한 값을 생성하는 다른 행렬로 . 주문함으로써 그래서 크기가 줄어들고 가정 똑같이 0이 아닙니다), 좋은 선택 이다
대각선 요소 아르
특히, 효과 모든 각도에서 (원래 또는 변경 된 형태의) 모든 것은 완전히
허락하다 . 벡터의 길이를 변경해도 벡터의 각도가 변경되지 않기 때문에 과 단위 벡터입니다. 평면에서 그러한 모든 벡터는 그들이 이루는 각도에 의해 지정 될 수있다우리가 쓸 수 있도록
따라서
(아래 그림 참조)
지원 간단합니다 : 첫 번째 좌표를 수정합니다 과 두 번째 좌표에 . 따라서 각도에서 에 이다
때문에 연속 함수이고,이 각도의 차이는 . 실제로, 그것은 구별 할 수 있습니다. 이를 통해 미분의 제로를 검사하여 극단적 인 각도를 찾을 수 있습니다. 이 미분은 계산하기가 간단합니다. 삼각 함수의 비율입니다. 0은 분자의 0 사이에서만 발생할 수 있으므로 분모를 계산하지 않아도됩니다. 우리는 얻는다
특별한 경우 , ,과 쉽게 이해할 수 있습니다 : 그들은 상황에 해당합니다 순위가 낮아지고 (모든 벡터를 한 줄로 찌그러 뜨림); 어디는 동일성 행렬의 배수이며; 어디서 과 평행하다 (그들 사이의 각도는 ). 경우 조건에 의해 배제 .
이러한 특별한 경우를 제외하고 0은 : 그건, 또는 . 이것은 라인이 각도를 이등분하다 . 우리는 이제 사이의 각도의 극값이 과 의 가치 사이에 있어야합니다 계산해 봅시다 :
해당 코사인은
과
종종 방법을 이해하는 것으로 충분합니다 직각을 왜곡합니다. 이 경우으로 이어지는 위의 수식에 연결할 수 있습니다.
더 작은 이 각도가 커질수록 왜곡이 커집니다.
이 그림은 벡터의 네 가지 구성을 보여줍니다 과 각도로 분리 . 단위 원과 타원형 이미지 아래 참조를 위해 음영 처리됩니다 ( 균일하게 크기 조정 ). 그림 제목은 다음의 값을 나타냅니다.의 중점 과 . 그런 가장 가까운 과 에 의해 변환 될 때 올 수 있습니다 왼쪽과 같은 구성입니다 . 가장 멀리 떨어져있는 것은 오른쪽에있는 것과 같은 구성입니다.. 두 가지 중간 가능성이 표시됩니다.
우리는 방법을 보았습니다 각 차원을 확장하여 행동 한 요인으로 . 이것은 단위 구체를 왜곡합니다타원체로. 그만큼주축을 결정합니다. 그만큼이 축을 따라 원점에서 타원체까지의 거리입니다. 결과적으로 가장 작은 것이, 원점에서 타원체까지 의 가장 짧은 거리 (모든 방향), 원점에서 타원체까지의 거리 (모든 방향)입니다.
더 높은 차원에서 , 과 2 차원 부분 공간의 일부입니다. 이 부분 공간의 단위 원을 포함하는 평면과 타원체의 교차점에 매핑합니다. 과 . 원의 선형 왜곡 인이 교차점은 타원입니다. 분명히이 타원까지의 가장 먼 거리는 최단 거리는 .
이전 섹션의 끝에서 관찰 한 것처럼 가장 극단적 인 가능성은 과 두 가지를 포함하는 비행기에 위치 해당하는 비율 가능한 한 작습니다. 이것은에서 일어날 것입니다비행기. 우리는 이미 그 경우에 대한 해결책을 가지고 있습니다.
적용하여 얻을 수있는 코사인 유사성의 극단 코사인 유사성을 갖는 두 벡터에 ~에 의해 주어진다 과 . 그들은 situating에 의해 달성 과 방향과 같은 각도로 모든 벡터를 최대한 길게 (예 : 방향)으로 분리하여 모든 벡터를 최소한으로 늘립니다 (예 : 방향).
이 극단 값은 SVD의 관점에서 계산할 수 있습니다. .
다음에 관심이있을 것입니다.
당신은 대각선 화 할 수 있습니다 (또는 여러분이 PCA라고 부르면) 변형 중 투사하여 동작 이 새로운 공간에서 유사성을 계산합니다. 이것을 조금 더 살리려면 주성분을 고유 값 . 그때
그것은 당신에게 제공합니다 :
여기에 스케일링이 진행됩니다. 스트레칭 / 수축 중입니다. 언제 단위 벡터이며 모든 경우 그런 다음 회전에 해당하고 다음을 얻습니다. 이는 내부 제품이 회전하는 동안 변하지 않는다고 말하는 것과 같습니다. 일반적으로 각도는 이 경우 등각 변환이 필요합니다. 돌이킬 수없고 극의 분해 만족시키다 와 즉 .