PCA biplot을 생성하는 방법은 여러 가지가 있으므로 질문에 대한 고유 한 답변이 없습니다. 다음은 간단한 개요입니다.
데이터 행렬 는 행으로 데이터 포인트를 가지며 중심에 있다고 가정합니다 (즉, 열 평균은 모두 0 임). 현재로서는 표준화되었다고 가정 하지 않습니다 . 즉, 상관 행렬이 아닌 공분산 행렬에 대한 PCA를 고려합니다. PCA는 단일 값 분해 합니다 . SVD와 PCA의 관계에 대한 자세한 내용은 여기 확인할 수 있습니다 . SVD를 사용하여 PCA를 수행하는 방법?Xn
X=USV⊤,
PCA biplot에서 두 개의 첫 번째 주요 구성 요소는 산점도로 표시됩니다. 즉, 의 첫 번째 열은 두 번째 열에 대해 표시됩니다. 그러나 정규화는 다를 수 있습니다. 예를 들어 다음을 사용할 수 있습니다.U
- 열 : 이것들은 단위 제곱의 합으로 스케일링 된 주성분입니다.U
- 의 열 이러한 표준화 주성분 (단위 변화);n−1−−−−−√U
- 열 : "원시"주성분 (주 방향 투영)입니다.US
또한 원래 변수는 화살표로 표시됩니다. 즉 , 번째 화살표 끝점 의 좌표 는 의 첫 번째 및 두 번째 열의 번째 값으로 제공됩니다 . 그러나 다시 한 번 다른 정규화를 선택할 수 있습니다.(x,y)iiV
- 열 : 여기에 어떤 해석이 있는지 모르겠습니다.VS
- 의 열VS/n−1−−−−−√
- V
Fisher Iris 데이터 세트의 모든 모습은 다음과 같습니다.
9XUSαβVS(1−α)/β9 "적절한 이중 도표": 즉 위의 하위 그림과 아래의 하위 그림의 조합입니다.
[어떤 조합을 사용하든, 화살표와 데이터 포인트가 대략 같은 스케일로 나타나도록 임의의 일정한 계수로 화살표를 스케일링해야 할 수도 있습니다.]
VS/n−1−−−−−√Un−1−−−−−√
이 [특별한 선택]은 물론 다변량 관측 값의 해석을 해석하는 데 가장 유용한 그래픽 지원을 제공 할 것입니다.
USV
US
biplot
UVSbiplot
0.8biplot
n/(n−1)1R의 PCA biplot에서 기본 변수의 화살표 .)
상관 행렬의 PCA
X1
1R=1
더 읽을 거리 :