답변:
규범을 정의하는 것으로 시작합시다. 행렬 경우 연산자 -norm은 및 Frobenius 규범을 \ | X \ | _F = \ sqrt {\ sum_ {ij} X_ {ij} ^ 2} = \ mathrm {tr} (X ^ \ top X) = \ sqrt {\ sum s_i ^ 2} , 여기서, s_i는 의 특이 값이다 X가 의 대각선 원소하여 예 S 특이 값 분해 X = USV ^ \ 가기 .
PCA는 데이터가 중심에있을 때 동일한 특이 값 분해로 제공됩니다. 는 주성분, 는 주축, 즉 공분산 행렬의 고유 벡터이며 k 개의 가장 큰 특이 값에 해당하는 k 개의 주성분 만으로 를 재구성 하는 것은 X_k = U_k S_k V_k ^ \ top로 주어집니다 .
정리 ECKART 영 말한다 재건 오류의 규범을 최소화 매트릭스는모두들 행렬 순위의 . 이것은 Frobenius 규범과 운영자 노름 모두에 해당됩니다 . 의견에서 @cardinal이 지적한 것처럼, 1907 년 Frobenius 사건에 대해 Schmidt (Gram-Schmidt 명성의)에 의해 처음 입증되었습니다. 그것은 1936 년에 Eckart와 Young에 의해 나중에 재발견되었으며 현재는 대부분 그들의 이름과 관련이 있습니다. Mirsky는 1958 년의 정리를 단일 변환에서 변하지 않는 모든 규범으로 일반화했으며 여기에는 연산자 2- 노름이 포함됩니다.
이 정리는 때때로 Eckart-Young-Mirsky 정리라고합니다. 스튜어트 (1993)는 이것을 슈미트 근사 정리라고 부릅니다. 나는 그것을 슈미트-에카르트-영-미르 스키 정리라고 부르기도했다.
를 전체 순위 이라고합시다 . 마찬가지로 랭크이다 , 그 널 공간 보유 치수. 가장 큰 특이 값에 해당하는 의 오른쪽 특이 벡터가 차지하는 공간은 차원입니다. 따라서이 두 공간은 서로 교차해야합니다. 교차점에서 단위 벡터로 하자 . 그러면 QED.
를 최소화 하는 랭크 의 행렬 를 찾고 . 인수 분해 할 수 있습니다 . 여기서 에는 정규 직교 열이 있습니다. 고정 대해 를 최소화하는 것은 솔루션 의 회귀 문제입니다 . 연결하면 이제 를 최소화해야합니다. 여기서 는 의 공분산 행렬입니다 . 즉
이들 먼저 것을 잘 알려진 공분산 행렬의 고유 벡터. 실제로 인 경우 입니다. 직교 정규 열도 포함하는 를 쓰면 . 때 최대 값을 . 그러면 정리가 즉시 뒤 따릅니다.
다음 세 가지 관련 스레드를 참조하십시오.
이 증거는 온라인 어딘가에서 찾았지만 주석에서 @cardinal에 설명 된 것처럼 잘못되었습니다 (갭이 있음).
Frobenius 규범은 단일 값을 변경하지 않기 때문에 단일 변환에서 변하지 않습니다. 그래서 우리는 얻는다 : 여기서 . 계속 : 대각선 모든 요소 가 0이고 모든 대각선 항이 가장 큰 특이 값 취소 할 때 최소화됩니다 ( 예 : 는 분명하지 않음) . 즉, 그리고 따라서 .