다음과 같이 수행 된 주요 구성 요소 분석 결과를 이해하려고합니다.
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> res = prcomp(iris[1:4], scale=T)
> res
Standard deviations:
[1] 1.7083611 0.9560494 0.3830886 0.1439265
Rotation:
PC1 PC2 PC3 PC4
Sepal.Length 0.5210659 -0.37741762 0.7195664 0.2612863
Sepal.Width -0.2693474 -0.92329566 -0.2443818 -0.1235096
Petal.Length 0.5804131 -0.02449161 -0.1421264 -0.8014492
Petal.Width 0.5648565 -0.06694199 -0.6342727 0.5235971
>
> summary(res)
Importance of components:
PC1 PC2 PC3 PC4
Standard deviation 1.7084 0.9560 0.38309 0.14393
Proportion of Variance 0.7296 0.2285 0.03669 0.00518
Cumulative Proportion 0.7296 0.9581 0.99482 1.00000
>
위의 결과에서 다음을 결론 짓는 경향이 있습니다.
분산의 비율은 특정 주성분의 분산에서 총 분산의 양을 나타냅니다. 따라서 PC1 변동성은 전체 데이터 변동의 73 %를 설명합니다.
표시된 회전 값은 일부 설명에서 언급 된 '로드'와 동일합니다.
PC1의 회전을 고려할 때 Sepal.Length, Petal.Length 및 Petal.Width는 직접적으로 관련되어 있으며 모두 Sepal.Width (PC1의 회전에서 음의 값을 가짐)와 반비례 관계가 있다고 결론 내릴 수 있습니다.
식물에 영향을 줄 수있는 요인 (일부 화학 / 물리 기능 시스템 등)이있을 수 있습니다 (한 방향으로 세로 길이, 꽃잎 길이 및 꽃잎 너비, 반대 방향으로 Sepal.Width).
하나의 그래프에 모든 회전을 표시하려면 각 회전에 해당 주성분의 분산 비율을 곱하여 총 변동에 대한 상대적 기여도를 표시 할 수 있습니다. 예를 들어, PC1의 경우 0.52, -0.26, 0.58 및 0.56의 회전에 0.73 (PC1의 비례 분산)이 곱 해져 요약 (res) 출력으로 표시됩니다.
위의 결론에 대해 맞습니까?
질문 5 관련 편집 : 다음과 같이 간단한 회전 차트에 모든 회전을 표시하고 싶습니다.
PC2, PC3 및 PC4는 변동에 대한 점진적인 기여가 적으므로 변수의 하중을 조정 (감소)하는 것이 합리적입니까?