여러 차원의 분산 ( "총 분산")으로 이해되는 것은 단순히 각 차원의 분산의 합입니다. 수학적으로 공분산 행렬의 흔적입니다. 추적은 단순히 모든 대각선 요소의 합입니다. 이 정의에는 직교 선형 변환에서 트레이스가 변하지 않는 등 다양한 속성이 있습니다. 즉, 좌표축을 회전하면 총 분산이 동일하게 유지됩니다.
주교의 책 (섹션 12.1.1)에서 입증 된 것은 공분산 행렬의 주요 고유 벡터가 최대 분산의 방향을 제공한다는 것입니다. 두 번째 고유 벡터는 첫 번째 고유 벡터 등과 직교해야한다는 추가 제약 조건에서 최대 분산 방향을 제공합니다 (이것이 연습 12.1을 구성한다고 생각합니다). 목표가 2D 부분 공간에서 총 분산을 최대화하는 것이라면이 절차는 탐욕스러운 최대화입니다. 먼저 분산을 최대화하는 축 하나를 선택한 다음 다른 축을 선택하십시오.
귀하의 질문은 :이 탐욕스러운 절차가 왜 세계 최대치를 얻습니까?
다음은 @whuber가 의견에서 제안한 멋진 주장입니다. 먼저 좌표계를 PCA 축에 정렬합시다. 공분산 행렬은 대각선이됩니다 : . 단순화를 위해 동일한 2D 사례, 즉 최대 총 분산이있는 평면은 무엇입니까? 우리는 그것이 처음 두 기본 벡터 (총 분산 )에 의해 주어진 평면임을 증명하고 싶습니다 .Σ = d i a g (λ나는)λ1+λ2
두 개의 직교 벡터 및 걸쳐있는 평면을 고려하십시오 . 이 평면의 총 분산은따라서 고유 값 와 모두 양의 계수를 갖는 선형 조합이며 , 초과하지 않고 (아래 참조) 합계는 입니다. 그렇다면 최대 값이 도달한다는 것이 거의 확실합니다 .유V
유⊤Σ u +V⊤Σ v = ∑λ나는유2나는+ ∑λ나는V2나는= ∑λ나는(유2나는+V2나는) .
λ나는12λ1+λ2
계수가 초과 할 수 없음을 표시하는 것만 남았습니다 . 공지 그 여기서 는 IS 번째 기저 벡터. 이 수량은 와 의해 스팬 된 평면 에 의 투영 길이입니다 . 따라서 QED의 과 동일한 의 제곱 길이보다 작아야합니다 .1유2케이+V2케이= ( u ⋅ k)2+ ( v ⋅ k)2케이케이케이유V케이| 케이|2= 1
PCA의 목적 함수 란 무엇인가에 대한 @cardinal의 답변도 참조하십시오 . (같은 논리를 따릅니다).