선형 변환 후 코사인 유사성이 어떻게 변합니까?


9

다음과 같은 수학적 관계가 있습니까?

  • 코사인 유사성 sim(A,B) 두 벡터의 AB,
  • 코사인 유사성 sim(MA,MB)AB주어진 행렬을 통해 균일하지 않은 스케일링M? 여기M 대각선에 요소가 다른 주어진 대각선 행렬입니다.

계산을 시도했지만 간단하고 흥미로운 링크 (식)에 도달 할 수 없었습니다. 나는 그것이 있는지 궁금합니다.


예를 들어, 각도는 비 균일 스케일링에서 유지되지 않지만 원래 각도와 비 균일 스케일링 후 각도 사이의 관계는 무엇입니까? 벡터 세트 S1과 다른 세트의 벡터 S2 사이의 링크에 대해 무엇을 말할 수 있습니까?


@ whuber, 감사합니다! 예, M은 주어진 행렬입니다 (확대 행렬-따라서 대각선 행렬, 다른 제한 없음). 어떤 의미에서, 나는 비선형 스케일링을 겪는 벡터 공간에 (어떤 벡터 쌍에 대한 코사인 유사성으로) 어떤 일이 일어나는지 알고 싶었습니다.
turdus-merula

2
모든 스케일 팩터가 음수가 아닌 경우 (자연스럽게 가정 할 때), 모든 대칭 양의 유한 행렬은 "스케일링"행렬로 간주 될 수 있습니다. 당신이 찾는 관계는 특히 지도 투영의 왜곡에 대한 연구와 설명에서 광범위하게 사용됩니다 . 여기서 관심 은 지구 표면 의 최대최소 각도를 중심 으로하여지도에서 두 개의 수직 방향 과 연관 됩니다. 이 각도와 두 척도 비율 사이에는 직접적인 관계가 있습니다.
whuber

답변:


8

때문에 M 매우 일반적이며 코사인 유사성의 변화는 AB 그리고 그들의 관계 M명확한 공식은 없습니다. 그러나 코사인 유사성이 얼마나 많이 변할 수 있는지에 대한 실질적으로 계산 가능한 한계가 있습니다 . 그들은 사이의 각도를 극단화하여 찾을 수 있습니다MAMB 주어진 사이의 코사인 유사성 AB 지정된 값입니다. cos(2ϕ) (어디 2ϕ 사이의 각도 AB). 대답은 어느 각도인지 알려줍니다2ϕ 변형에 의해 구부러 질 수 있음 M.

계산이 지저분해질 위험이 있습니다. 일부 간단한 단순화와 함께 일부 영리한 표기법 선택으로 인해 노력이 줄어 듭니다. 그것은 밝혀 2 차원의 해결책이 우리가 알아야 할 모든 것을 알 수있다. 하나의 실제 변수에 따라 다루기 힘든 문제입니다.θ미적분 기법을 사용하여 쉽게 해결됩니다. 간단한 기하학적 인수는이 솔루션을 여러 차원으로 확장합니다n.

수학적 예비

정의에 따르면 두 벡터 사이의 각도의 코사인 AB단위 길이로 정규화하고 제품을 가져 와서 얻을 수 있습니다. 그러므로,

AB(AA)(BB)=cos(2ϕ)

그리고, 쓰기 Σ=MM의 이미지 사이의 각도의 코사인 AB 변형 아래 M 이다

(1)(MA)(MB)((MA)(MA))((MB)(MB))=AΣB(AΣA)(BΣB).

오직 Σ분석의 문제가 아니라M그 자체. 따라서 우리는 SVD (Singular Value Decomposition) 를 활용할 수 있습니다.M문제를 단순화합니다. 이것이 표현한다는 것을 기억하십시오M 직교 행렬의 곱 (오른쪽에서 왼쪽으로) V대각 행렬 D, 그리고 다른 직교 행렬 U:

M=UDV.

다시 말해서, 특권 벡터의 기초가 있습니다 e1,,en (의 열 V) M 각각의 크기를 조정하여 작동 ei 에 의해 별도로 ith 대각선 입구 D (내가 전화 할 것이다 di) 이후 회전 (또는 회전 방지)을 적용합니다. U결과에. 최종 회전은 길이나 각도를 변경하지 않으므로 영향을 미치지 않아야합니다.Σ. 계산을 통해 공식적으로 볼 수 있습니다

Σ=MM=(UDV)(UDV)=VD(UU)DV=VD2V.

결과적으로 연구 Σ 우리는 자유롭게 바꿀 수 있습니다 M 동일한 값을 생성하는 다른 행렬로 (1). 주문함으로써ei 그래서 di 크기가 줄어들고 가정 M 똑같이 0이 아닙니다), 좋은 선택 M 이다

M=1d1DV.

대각선 요소 (1/d1)D 아르

1=d1/d1λ2=d2/d1λ3=d3/d1λn=dn/d10.

특히, 효과 M 모든 각도에서 (원래 또는 변경 된 형태의) 모든 것은 완전히

Mei=λiei.

특별한 경우의 분석

허락하다 n=2. 벡터의 길이를 변경해도 벡터의 각도가 변경되지 않기 때문에AB단위 벡터입니다. 평면에서 그러한 모든 벡터는 그들이 이루는 각도에 의해 지정 될 수있다e1우리가 쓸 수 있도록

A=cos(θϕ)e1+sin(θϕ)e2.

따라서

B=cos(θ+ϕ)e1+sin(θ+ϕ)e2.

(아래 그림 참조)

지원 M 간단합니다 : 첫 번째 좌표를 수정합니다 AB 두 번째 좌표에 λ2. 따라서 각도에서MAMB 이다

f(θ)=arctan(λ2tan(θ+ϕ))arctan(λ2tan(θϕ)).

때문에 M 연속 함수이고,이 각도의 차이는 θ. 실제로, 그것은 구별 할 수 있습니다. 이를 통해 미분의 제로를 검사하여 극단적 인 각도를 찾을 수 있습니다f(θ). 이 미분은 계산하기가 간단합니다. 삼각 함수의 비율입니다. 0은 분자의 0 사이에서만 발생할 수 있으므로 분모를 계산하지 않아도됩니다. 우리는 얻는다

f(θ)=λ2(1λ2)(λ2+1)sin(2θ)sin(2ϕ).

특별한 경우 λ2=0, λ2=1,과 ϕ=0 쉽게 이해할 수 있습니다 : 그들은 상황에 해당합니다 M순위가 낮아지고 (모든 벡터를 한 줄로 찌그러 뜨림); 어디M는 동일성 행렬의 배수이며; 어디서AB 평행하다 (그들 사이의 각도는 θ). 경우λ2=1 조건에 의해 배제 λ20.

이러한 특별한 경우를 제외하고 0은 sin(2θ)=0: 그건, θ=0 또는 θ=π/2. 이것은 라인이e1 각도를 이등분하다 AB. 우리는 이제 사이의 각도의 극값이MAMB 의 가치 사이에 있어야합니다 f(θ)계산해 봅시다 :

f(0)=arctan(λ2tan(ϕ))arctan(λ2tan(ϕ))=2arctan(λ2tan(ϕ));f(π/2)=arctan(λ2tan(π/2+ϕ))arctan(λ2tan(π/2ϕ))=2arctan(λ2cot(ϕ)).

해당 코사인은

(2)cos(f(0))=1λ22tan(ϕ)21+λ22tan(ϕ)2

(3)cos(f(π/2))=1λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2λ22tan(ϕ)2+λ22.

종종 방법을 이해하는 것으로 충분합니다 M직각을 왜곡합니다. 이 경우2ϕ=π/2으로 이어지는 tan(ϕ)=cot(ϕ)=1위의 수식에 연결할 수 있습니다.

더 작은 λ2 이 각도가 커질수록 왜곡이 커집니다.

네 가지 구성을 보여주는 그림

이 그림은 벡터의 네 가지 구성을 보여줍니다 AB 각도로 분리 2ϕ=π/3. 단위 원과 타원형 이미지 아래M 참조를 위해 음영 처리됩니다 ( M 균일하게 크기 조정 λ1=1). 그림 제목은 다음의 값을 나타냅니다.θ의 중점 AB. 그런 가장 가까운AB 에 의해 변환 될 때 올 수 있습니다 M 왼쪽과 같은 구성입니다 θ=0. 가장 멀리 떨어져있는 것은 오른쪽에있는 것과 같은 구성입니다.θ=π/2. 두 가지 중간 가능성이 표시됩니다.

모든 차원의 솔루션

우리는 방법을 보았습니다 M 각 차원을 확장하여 행동 i 한 요인으로 λi. 이것은 단위 구체를 왜곡합니다{A|AA=1}타원체로. 그만큼ei주축을 결정합니다. 그만큼λi이 축을 따라 원점에서 타원체까지의 거리입니다. 결과적으로 가장 작은 것이λn, 원점에서 타원체까지 의 가장 짧은 거리 (모든 방향)λ1, 원점에서 타원체까지의 거리 (모든 방향)입니다.

더 높은 차원에서 n>2, AB 2 차원 부분 공간의 일부입니다. M 이 부분 공간의 단위 원을 포함하는 평면과 타원체의 교차점에 매핑합니다. MAMB. 원의 선형 왜곡 인이 교차점은 타원입니다. 분명히이 타원까지의 가장 먼 거리는λ1=1 최단 거리는 λn.

이전 섹션의 끝에서 관찰 한 것처럼 가장 극단적 인 가능성은 AB 두 가지를 포함하는 비행기에 위치 ei 해당하는 비율 λi가능한 한 작습니다. 이것은에서 일어날 것입니다e1,en비행기. 우리는 이미 그 경우에 대한 해결책을 가지고 있습니다.

결론

적용하여 얻을 수있는 코사인 유사성의 극단 M 코사인 유사성을 갖는 두 벡터에 cos(2ϕ) ~에 의해 주어진다 (2)(3). 그들은 situating에 의해 달성AB 방향과 같은 각도로 Σ=MM 모든 벡터를 최대한 길게 (예 : e1 방향)으로 분리하여 Σ 모든 벡터를 최소한으로 늘립니다 (예 : en 방향).

이 극단 값은 SVD의 관점에서 계산할 수 있습니다. M.


이것은 환상적인 답변입니다! 이 자세한 토론에 감사드립니다! 나는 당신이 eqn (3)에서 부호 마이너스 부호를 가지고 있다고 생각합니다.
LFH

나는 각도가 흥미로운 경우에 관심이 있습니다 2ϕ 0에 접근하고 사이에 불평등을 원합니다. 2ϕf. 귀하의 계산에 따라 가장 극단적 인 것을 찾아야한다는 것이 사실입니까?λn 이 경우 점근 적 불평등은 2λnϕf2λn1ϕ 같이 ϕ0?
LFH

6

다음에 관심이있을 것입니다.

(MA,MB)=AT(MTM)B,

당신은 대각선 화 할 수 있습니다 MTM=UΣUT (또는 여러분이 PCA라고 부르면) A,B 변형 중 M 투사하여 동작 A,B이 새로운 공간에서 유사성을 계산합니다. 이것을 조금 더 살리려면 주성분을ui 고유 값 λi. 그때

UB=i(ui,bi)ui, UA=i(ui,ai)ui,

그것은 당신에게 제공합니다 :

(MA,MB)=i=1n(ui,ai)(ui,bi)λi.

여기에 스케일링이 진행됩니다. λi스트레칭 / 수축 중입니다. 언제A,B 단위 벡터이며 모든 경우 λi=1그런 다음 M 회전에 해당하고 다음을 얻습니다. sim(MA,MB)=sim(A,B)이는 내부 제품이 회전하는 동안 변하지 않는다고 말하는 것과 같습니다. 일반적으로 각도는M 이 경우 등각 변환이 필요합니다. M 돌이킬 수없고 극의 분해 M 만족시키다 M=OPP=aIMTM=a2I.


1
문제에 대한 초기 진술은 벡터의 정규화를 무시합니다. A, B, MA, MB코사인 유사성을 계산하는 데 필요합니다. 후속 분석에서도이 정규화를 다루지 않는 것으로 보입니다. 특히, 모든 고유 값이 다른 (양수) 값과 동일한 경우에도 코사인 유사성이 유지됩니다.1. 그것은이 간단한 경우에도 훨씬 더 많은 것을 말할 수 있음을 보여줍니다.
whuber

@ whuber : 코사인 유사성이 정확히 유지 될 때 M 컨 포멀 변환이며,이 경우에는 M 돌이킬 수없는 MTM=a2I, 정체성의 배수. 다른 방법으로, 극의 분해M 만족시키다 M=OP, 어디 P=aI. 정규화에 대해서는 맞지만 정규화되지 않은 벡터와 코사인 유사성에 대해 이야기하는 것은 어리석은 것처럼 보입니다.A,B.
Alex R.

2
전혀 바보가 아닙니다! 이 "유사성"은 벡터 사이의 각도의 코사인에 의해 주어 지므로, 두 개의 0이 아닌 벡터에 적합합니다. 내가 "훨씬 더 많이 말할 수있다"는 것은 이미지 사이의 각도에 대한 효과적인 경계입니다.AB 사이의 각도로 얻을 수 있습니다 AB 그리고 고유 값 M.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.