PCA (Principal Component Analysis)의 목적 함수는 L2 규범의 재구성 오류를 최소화하는 것입니다 ( 여기 섹션 2.12 참조) . 또 다른 관점은 투영의 분산을 최대화하려고 시도하는 것입니다. 또한 PCA의 목적 함수는 무엇입니까? ? ).
내 질문은 PCA 최적화 볼록한 것입니까? (나는 여기서 몇 가지 토론을 찾았 지만 누군가가 이력서에 대한 좋은 증거를 제공 할 수 있기를 바랍니다).
PCA (Principal Component Analysis)의 목적 함수는 L2 규범의 재구성 오류를 최소화하는 것입니다 ( 여기 섹션 2.12 참조) . 또 다른 관점은 투영의 분산을 최대화하려고 시도하는 것입니다. 또한 PCA의 목적 함수는 무엇입니까? ? ).
내 질문은 PCA 최적화 볼록한 것입니까? (나는 여기서 몇 가지 토론을 찾았 지만 누군가가 이력서에 대한 좋은 증거를 제공 할 수 있기를 바랍니다).
답변:
아닙니다 . PCA의 일반적인 제형은 볼록한 문제 가 아닙니다 . 그러나 그것들은 볼록 최적화 문제로 변형 될 수 있습니다.
이것의 통찰력과 재미는 단순히 답을 얻는 것이 아니라 변화의 순서를 따르고 시각화하는 것입니다. 그것은 목적지가 아닌 여정에 있습니다. 이 여행의 주요 단계는
목적 함수에 대한 간단한 표현을 얻으십시오.
볼록하지 않은 영역을 원래 영역으로 확대합니다.
볼록하지 않은 목표를 최적의 값을 얻는 지점 을 명백하게 변경하지 않는 방식으로 수정하십시오 .
주의 깊게 살펴보면 SVD 및 Lagrange 멀티 플라이어가 숨어있는 것을 볼 수 있지만 경치가 좋기 때문에 사이드 쇼 일 뿐이며 더 이상 언급하지 않습니다.
PCA의 표준 분산 최대화 제제 (또는 적어도 핵심 단계)는 다음과 같습니다.
여기서 행렬 행렬 는 데이터 (일반적으로 제곱과 곱의 합, 공분산 행렬 또는 상관 행렬의 합)로 구성된 대칭의 양의 반음 수 행렬입니다.A
(동일하게, 우리는 제한되지 않은 목표 를 최대화하려고 시도 할 수 있습니다 . 이것은 표현 일뿐만 아니라 더 이상 이차 함수가 아닙니다. 그러나 특별한 경우를 그래프로 표시합니다. 볼록 함수가 아니라는 것을 신속하게 보여줍니다. 보통 조정하면이 함수가 변하지 않는 것을 관찰 한 다음 제약 된 공식 입니다.)x → λ x ( ∗ )
모든 최적화 문제는 다음과 같이 추상적으로 공식화 될 수 있습니다.
함수 을 가능한 크게 만드는 적어도 하나의 를 찾으십시오 . f : X → R
리콜은 최적화 문제는 볼록 이 즐기는 경우 두 개의 별도의 속성을 :
도메인 볼록하다. 이것은 여러 가지 방법으로 공식화 될 수 있습니다. 하나는 그 때마다 및 및 , 도 . 기하학적으로 : 선 세그먼트의 두 끝 점이 에있을 때마다 전체 세그먼트는 있습니다. y∈ X 0≤λ≤1λx+(1−λ)y∈ X X X
함수 볼록하다. 이것은 또한 여러 가지 방법으로 공식화 될 수 있습니다. 하나는 및 및 ,( 이 조건을 이해 하려면 가 볼록해야했습니다.) 기하학적 : 가 선분 일 때마다 의 그래프 (이 세그먼트로 제한됨)는 위에 있습니다. 또는 및 를 연결하는 세그먼트 에서 . y ∈ X 0 ≤ λ ≤ 1 f ( λ x + ( 1 - λ ) y ) ≥ λ f ( x ) + ( 1 - λ ) f ( y ) . X ¯ x y X f ( x , f ( x ) ) ( y , f ( y
볼록 함수의 아키타 입은 비 양성 리딩 계수를 사용하여 지역적으로 포물선입니다. 모든 선분에서 으로 으로 표현할 수 있습니다
의 어려움 은 가 단위 구 이며 결정적으로 볼록하지 않다는 것입니다. 그러나 더 작은 벡터를 포함하여이 문제를 수정할 수 있습니다. 우리가 확장 될 때 때문이다 계수로 , 곱한 . 경우 , 우리는 확장 할 수있는 취부 길이 곱하여 함으로써 증가 있지만 내에 머물고 단위 공 . 그러므로 다음과 같이 를 재구성하자
그 도메인은 이며 볼록한 모양이므로 반쯤 있습니다. 의 그래프의 볼록성을 고려해야합니다 . f
해당 계산을 수행하지 않더라도 문제 를 생각 하는 좋은 방법 은 스펙트럼 정리에 관한 것입니다. 이 직교 변환에 의해서 있다고 하면 중 적어도 하나 개를 기초로 확인할 수 에 즉 :은 대각선R n A
여기서 의 비 대각선 항목은 모두 0입니다. 이러한 의 선택은 에 대해 전혀 아무것도 바꾸지 않고 단지 그것을 묘사 하는 방법을 바꾸는 것으로 생각할 수 있습니다 : 당신의 관점을 회전시킬 때, 함수의 수평 초 표면 (항상 타원체) 는 좌표축과 정렬됩니다.P A x → x ′ A x
이후 포지티브 semidefinite하고, 모든 대각선 엔트리 음수이어야한다. 우리는 축을 다시 치환하여 (또 다른 직교 변환이므로 로 흡수 할 수 있습니다 ) 을 보장합니다
우리가 할 수있는 경우 새로운 좌표를 (수반 ) 함수 이고
이 기능은 확실히 볼록 하지 않습니다 ! 이 그래프는 하이퍼 포물면의 일부처럼 보입니다. 내부의 모든 지점에서 모든 가 음이 때문에 아래쪽이 아니라 위쪽으로 말립니다 .
그러나 우리는 를 매우 유용한 기술 한 가지로 볼록한 문제로 바꿀 수 있습니다 . 여기서 최대가 발생할 것을 알고 , 하자가 일정 빼기 에서 , 의 경계에 적어도 점에 대해 . 즉, 임의의 점의 위치를 변경하지 않을 경계 하는 그것의 모든 값이 저하하기 때문에, 최적화 동일한 값으로 경계를 . 이것은 기능 검사를 제안합니다
이것은 실제로 경계점 에서 상수 을 에서 빼고 내부 점에서 더 작은 값을 뺍니다. 이것은 와 비교하여 가 내부에 새로운 세계적 최대치를 갖지 않도록 보장 할 것 입니다.
을 로 바꾸는이 엉뚱한 손으로 어떤 일이 있었는지 살펴 보자 . 때문에 직교 인, . (실제로 직교 변환의 정의입니다.) 따라서 좌표로 를 쓸 수 있습니다.
모든 에 대해 이기 때문에 각 계수는 0이거나 음수입니다. 결과적으로 (a) 는 볼록하고 (b) 는 때 최적화됩니다 . ( 을 의미하며 일 때 최적을 습니다. 부호- 의 첫 번째 열 )
논리를 요약하자. 왜냐하면 경계에 최적화 여기서 로 인해 상이 단순히 상수 그 경계 및 값 때문에 심지어이다 가까이 의 값 의 내부에 의 최대 값 의 최대 값과 일치해야 .
아니.
매트릭스 의 랭크 PCA는 다음 과 같이 공식화 될 수있다
( 는 Frobenius norm입니다 ). 도출에 대해서는 Eckart-Young 정리를 참조하십시오 .
규범은 볼록하지만 최적화 된 세트는 볼록하지 않습니다.
PCA 문제 의 볼록한 완화 를 볼록한 낮은 순위 근사라고합니다.
( 는 핵 규범 입니다. 은 벡터에 대한 0이 아닌 요소 수의 볼록한 이완 과 같이 순위의 볼록한 이완입니다 ) ″ ⋅ ″ 1
자세한 내용 은 희소성 통계 학습 , 6 장 (행렬 분해)을 볼 수 있습니다 .
보다 일반적인 문제와 문제가 볼록성과 관련이있는 경우 일반화 된 낮은 순위 모델을 참조하십시오 .
면책 조항 : 이전 답변은 원래의 제형에서 PCA가 볼록하지 않지만 볼록 최적화 문제로 변환되는 방법을 설명하는 데 꽤 효과적입니다. 내 대답은 Unit Spheres와 SVD의 전문 용어에 익숙하지 않은 가난한 영혼 (예 : btw, 알기 쉬운)을위한 것입니다.
저의 출처는 티브 라니 교수의 강의 노트입니다.
볼록 최적화 기술로 최적화 문제를 해결하려면 두 가지 전제 조건이 있습니다.
PCA의 대부분의 제형은 매트릭스의 순위에 대한 제약을 포함한다.
이러한 유형의 PCA 제형에서, 조건 2가 위반된다. 따라서 구속 조건 은 볼록하지 않습니다. 예를 들어, , 각각 왼쪽 위 모서리와 오른쪽 아래 모서리에 각각 1을 갖는 2 × 2 0 행렬로 설정하십시오. 그런 다음 각각의 순위는 1이지만 평균은 2입니다.J 11 J 22