하중 ( 고유 벡터와 혼동해서는 안 됨 )에는 다음과 같은 속성이 있습니다.
- 각 성분 내 제곱의 합은 고유 값 (성분의 분산)입니다.
- 하중은 (표준화 된) 성분으로 변수를 예측하는 선형 조합의 계수입니다.
로딩 행렬 과 고유 값 :ㅏ
A (loadings)
PC1 PC2
X1 .5000000000 .5000000000
X2 .5000000000 .5000000000
X3 .5000000000 -.5000000000
X4 .5000000000 -.5000000000
Eigenvalues:
1.0000000000 1.0000000000
이 경우 두 고유 값이 동일합니다. 실제 세계에서는 드문 경우이며, PC1과 PC2는 동일한 설명 "강도"라고 말합니다.
또한 구성 요소 값인 Nx2
행렬 계산 하고 각 열 내에서 z 표준화 (평균 = 0, 표준 개발 = 1)한다고 가정합니다. 이어서 (2 점 위에서 말한 것처럼), X = C ' . 당신은 4 만 2 PC를 왼쪽으로 기 때문에, (당신은 2 이상의 열이 부족 을 복원 된 데이터 값) X는 오류가 (있는 경우 고유 값 3, 4하지 제로인) - 정확한 수 없습니다.씨X^=CA′AX^
A4x4
B=(A−1)′B=A⋅diag(eigenvalues)−1=(A+)′diag(eigenvalues)
는 대각선에 고유 값이있는 정사각형 대각선 행렬이며 +
위첨자는 의사 역수를 나타냅니다. 귀하의 경우 :
diag(eigenvalues):
1 0
0 1
B (coefficients to predict components by original variables):
PC1 PC2
X1 .5000000000 .5000000000
X2 .5000000000 .5000000000
X3 .5000000000 -.5000000000
X4 .5000000000 -.5000000000
XNx4
C=XBC
PC1 = 0.5 * X1 + 0.5 * X2 + 0.5 * X3 + 0.5 * X4 ~ (X1 + X2 + X3 + X4) / 4
"첫 번째 요소는 평균 점수에 비례합니다"
PC2 = 0.5 * X1 + 0.5 * X2-0.5 * X3-0.5 * X4 = (0.5 * X1 + 0.5 * X2)-(0.5 * X3 + 0.5 * X4)
"두 번째 구성 요소는 첫 번째 점수 쌍과 두 번째 점수 쌍의 차이를 측정합니다"
B=A
B=A⋅diag(eigenvalues)−1B=R−1AR변수의 공분산 (또는 상관) 행렬입니다. 후자의 공식은 선형 회귀 이론에서 직접 나온 것입니다. 두 공식은 PCA 컨텍스트 내에서만 동일합니다. 요인 분석에서는 요인 점수가 아니며 (FA로 항상 근사한) 요인 점수를 계산하는 데 두 번째 공식을 사용해야합니다.
내 관련 답변 :
로딩 대 고유 벡터에 대해 자세히 설명 합니다.
어떻게 주성분 점수와 요인 점수하여 계산된다 .