PCA의 선형성


35

그러나 PCA는 선형 절차로 간주됩니다.

기음에이(엑스)기음에이(엑스1)+기음에이(엑스2)++기음에이(엑스),

여기서 입니다. 이는 데이터에 대해 PCA에 의해 획득 된 고유 벡터 행렬이라고한다 데이터의 합에 의해 얻어진 PCA 고유 벡터를 동일하게 합계 않는 행렬 . 그러나 다음과 같은 선형 함수 의 정의가 아닙니다 .X i X i f엑스=엑스1+엑스2++엑스엑스나는엑스나는에프

에프(엑스+와이)=에프(엑스)+에프(와이)?

그렇다면 PCA가이 매우 기본적인 선형성 조건을 충족시키지 못하면 왜 "선형"으로 간주됩니까?


나는 한때 PCA가 변수들 사이의 선형 의존성에 의존하기 때문에 "선형 프로 시저 패밀리에 속한다"는 글을 듣거나 들었다 (미안하지만 언제 어디서나 기억하지 못한다). Pearson 상관 행렬을 사용하고 가장 높은 분산의 선형 조합을 찾습니다.
Łukasz Deryło

4
이 질문의 본질은 보통 최소 제곱 회귀의 훨씬 간단하고 일상적인 설정을 고려함으로써 조금 더 명확해질 수 있습니다. 이것이 선형 통계 절차의 원형입니다. 그럼에도 불구하고, 최소 제곱 계수를 추정하는 과정은, 데이터 매트릭스의 명백히 비선형 함수 인 식 증명 같이 β = ( X ' X ) - 1 X ' , Y . (응답 벡터 y 의 선형 함수라는 점에 유의하십시오 .)엑스β^=(엑스'엑스)1엑스'와이와이
whuber

4
f (x) = x + 1도 "선형 함수"라는 것을 기억할 가치가 있지만 방금 말한 내용을 만족시키지 못합니다.
Mehrdad

그것은 (엑스1+엑스2)(엑스1+엑스2)엑스1엑스1+엑스2엑스2
Gabriel Romon

답변:


39

우리는 PCA 선형 방법이라고 말할 때, 우리는 환원 차원 매핑을 참조 고차원 공간에서 R의 P 낮은 차원 공간에 R의 K . PCA에서,이 맵핑은 x 를 PCA 고유 벡터의 행렬 로 곱함으로써 주어지며 , 따라서 명백하게 선형이다 (행렬 곱셈은 선형 임) : z = f ( x ) = Vx . 이는 차원 축소 매핑이 비선형 일 수있는 비선형 차원 축소 방법 과 대조적입니다 .에프:엑스아르 자형아르 자형케이엑스

=에프(엑스)=V엑스.

한편, 상단의 고유 벡터는 V 형R P × K를 데이터 매트릭스에서 계산 XR N × P 당신이라는 것을 사용하여 P C ( ) : 귀하의 질문에 V = P C ( X ) , 매핑은 확실히 비선형입니다. 비선형 절차 인 공분산 행렬의 고유 벡터를 계산합니다. (사소한 예로서, X2를 곱하면케이V아르 자형×케이엑스아르 자형×기음에이()

V=기음에이(엑스),
엑스2공분산 행렬을 만큼 증가 시키지만 고유 벡터는 단위 길이를 갖도록 정규화 된 것과 동일하게 유지됩니다.)4

이 사소한 답변에 대한 35 개의 공감대가 있다는 것은 꽤 어리석은 일입니다.
amoeba는

5

"선형"은 많은 것을 의미 할 수 있으며 공식적인 방식으로 독점적으로 사용되지는 않습니다.

PCA는 공식적인 의미에서 함수로 정의되지 않는 경우가 많으므로 선형 함수의 요구 사항을 충족시킬 필요는 없습니다. 당신이 말했듯이, 절차와 때로는 알고리즘으로 더 자주 설명됩니다 (이 마지막 옵션은 마음에 들지 않지만). 그것은 비공식적이고 잘 정의되지 않은 방식으로 선형이라고 종종 말합니다.

엑스나는

엑스나는에프와이(α)
α아르 자형케이와이케이와이

에프나는

에프와이(α)=나는=1케이α나는와이나는
와이

와이α나는j


3

PCA는 선형 변환을 제공합니다.

기음에이(엑스1+엑스2)(엑스1+엑스2)=(엑스1)+(엑스2)

기음에이(엑스1+엑스2)기음에이(엑스1)기음에이(엑스2)


선형 변환을 사용하지만 선형 변환 자체가 아닌 프로세스의 매우 간단한 예를 비교하면 다음과 같습니다.

(V)V[엑스,와이]=[1,0]

([1,1])[0,2]

([0,1])[1,0]

그러나

([1,1]+[0,1]=[1,2])[0.78,2.09][1,2]

각도 계산을 포함하는이 각도의 배가는 선형이 아니며, 고유 벡터의 계산이 선형이 아니라는 아메바의 진술과 유사합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.