PCA가 항상 좌표축을 회전시키는 경우 "회전 된"및 "회전되지 않은"주요 구성 요소는 무엇입니까?


13

내가 이해하는 한, 주요 구성 요소는 좌표축을 회전하여 최대 분산 방향에 정렬하여 얻습니다.

그럼에도 불구하고, 나는 "회전하지 않은 주성분"에 대해 계속 읽고 있으며, 통계 소프트웨어 (SAS)는 회전하지 않은 주성분뿐만 아니라 varimax로 회전 된 주성분을 제공합니다. 여기서 혼란스러워합니다. 주성분을 계산할 때 축이 이미 회전되어 있습니다. 그렇다면 또 다른 회전이 필요한 이유는 무엇입니까? "회전하지 않은 주성분"이란 무엇입니까?


1
소프트웨어 작동 방식에 대한 질문은 여기서 다루지 않지만 여기서 실제로 통계적인 질문을 할 수 있습니다. 기본 통계 문제를 명확히하기 위해 질문을 편집 할 수 있습니다. 관련된 통계적 개념을 이해하면 소프트웨어 관련 요소가 자명하거나 문서에서 쉽게 얻을 수 있습니다.
gung-모니 티 복원

1
@gung-제 질문은 소프트웨어에 관한 것이 아닙니다. 내가 잘못 배치했을 수 있습니다. 내가 알고 싶었던 것은 내 이해에 따라 최대 분산 라인에서 축을 회전시킬 때만 주성분을 얻는다는 것입니다. 그렇다면 회전되지 않은 주요 구성 요소는 무엇입니까? PCA에 대해 설명하는 다양한 페이지에서 찾은 용어입니다. 내 질문이 여전히 모호한 지 알려주세요.
Srewashi Lahiri

그것은 확실히 보인다 는 SAS에 대한처럼. 그렇지 않은 경우 SAS에 대한 참조를 제거하고 소프트웨어 중립적 인 용어로 질문을 다시 설명하도록 Q를 편집합니다. 이 글 을 읽고 싶을 수도 있습니다 .
gung-모니 티 복원

해당 소프트웨어에서 분석을 수행했기 때문에 SAS를 언급했습니다. 당신이 단어를 할인하더라도, 당신은 나에게 편집 된 질문의 버전에 대한 설명을 제공 할 수 있습니다. 또한 나는 실을 갔다. 내가 틀렸다면 친절하게 수정하십시오. 주성분을 계산할 때 축이 이미 회전되었음을 의미합니다. 따라서 다른 varimax 표기법이 필요하지 않습니다. 그렇습니까? 나는이 부분에 대해 정말로 혼란 스럽다. 미리 감사드립니다
Srewashi Lahiri

2
Srewashi, 귀하의 의견에 대한 귀하의 설명에 근거하여 귀하의 질문을 실질적으로 재 작성할 자유를 얻었습니다. 좋은 질문이라고 생각합니다, +1 내 수정 사항이 귀하의 의도를 반영하는지 확인하십시오! 언제든지 더 많이 편집 할 수 있습니다. Cc에서 @gung까지
아메바는 고

답변:


15

이것은 기술적이지 않은 답변이 될 것입니다.

당신이 맞습니다 : PCA는 본질적으로 좌표축의 회전이며, 각 성공적인 축은 가능한 한 많은 차이를 포착하도록 선택됩니다.

심리학과 같은 일부 분야에서 사람들은 결과 축을 해석하기 위해 PCA를 적용하는 것을 좋아합니다. 즉, 주축 # 1 (원래 변수의 특정 선형 조합 임)에 특정 의미가 있다고 말할 수 있기를 원합니다. 이 의미를 추측하기 위해 선형 조합의 가중치를 볼 수 있습니다. 그러나 이러한 가중치는 종종 지저분하며 명확한 의미를 식별 할 수 없습니다.

이 경우 사람들은 때때로 바닐라 PCA 솔루션으로 약간의 문제를 해결하려고합니다. 그들은 (어떤 기준에 의해 "의미있는"것으로 간주된다) 주축의 특정 번호를 가지고 가고, 또한 쉽게 해석 할 수있을 것이다, 선형 조합 일부 "단순한 구조를"--- 달성하기 위해 노력하고, 그들에게 돌립니다. 가장 간단한 구조를 찾는 특정 알고리즘이 있습니다. 그중 하나를 varimax라고합니다. varimax 회전 후, 후속 컴포넌트는 더 이상 가능한 많은 편차를 캡처하지 않습니다! 추가 varimax (또는 다른) 회전을 수행하여 PCA의이 기능이 손상됩니다.

따라서 varimax 회전을 적용하기 전에 "회전하지 않은"주성분이 있습니다. 그런 다음 "회전 된"기본 구성 요소를 얻게됩니다. 즉,이 용어는 PCA 회전 자체가 아니라 PCA 결과의 사후 처리를 나타냅니다 .


이 모든 것은 회전하는 것이 주축이 아닌 하중이기 때문에 다소 복잡합니다. 그러나 수학적 세부 사항을 보려면 여기에 긴 대답을 드리겠습니다. PCA와 회전 (varimax 등)이 여전히 PCA입니까?


아직 더 명확하고 명확한 설명을 얻지 못했습니다. 나는 또한 당신이 제공 한 다른 링크를 겪었지만 아직 완전히 해독하지는 못했습니다. 내가 올바르게 이해한다면 회전되지 않은 주성분은 이미 직교하고 상관이 없습니다. PC는 연속적인 최대 분산에 해당하므로 첫 번째 PC를 찾은 후 두 번째 최대 분산 선 (두 번째 PC)이 첫 번째 것과 90도 (직교)가되어야합니다. ?
Srewashi Lahiri

맞습니다 : "회전하지 않은"주성분은 서로 관련이없고 "회전되지 않은"주축은 직각입니다. 그리고 그렇습니다. 연속적인 주축은 직교적이고 주성분은 이전의 것과 상관 관계가 없어야합니다 (수학적으로 증명할 수 있습니다). 그건 그렇고,이 (또는 다른) 답변으로 문제가 해결되었다고 생각되면 왼쪽의 녹색 체크 표시를 클릭하여 "수락"할 수 있습니다. 당신이 15 명성에 도달하면, 당신은 또한 당신이 유용하다고 생각되는 답변을 찬성 투표 할 수 있습니다 (현재는 당신이 어떤 답변을 찬성 할 수 없다고 생각합니다).
amoeba는

+1. what gets rotated are loadings and not principal axes as such나는 이것이 기술적 개념이라고 덧붙일 것이다. 이론적으로,이 두 회전 종류는 병렬입니다. PCA에서 우리는 특정 직교 기저 (고유 가치의 가파른 도표를 가진 것)를 찾기 위해 회전합니다. varimax에서, 우리는 다른 특정 직교 기저를 찾기 위해 회전합니다 (가장 인터 페터 블 구조로). 우리는 모든 종류의 직교 기반을 할 수 있습니다.
ttnphns

가능하면 평신도 용어로 회전하지 않은 PC의 의미를 설명 할 수 있습니까?
sai_636

@ sai_636 평신도 용어는 stats.stackexchange.com/questions/2691을 참조하십시오 .
amoeba는 Reinstate Monica가
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.