AKA (Akaike Information Criterion)를 사용하여 PCA에서 추출 할 적절한 수의 요소를 선택하고 싶습니다. 유일한 문제는 매개 변수 수를 결정하는 방법을 잘 모르겠다는 것입니다.
행렬 고려하십시오. 여기서 은 변수 수를 나타내고 는 관측치 수를 나타냅니다. 예를 들어 입니다. 공분산 행렬이 대칭이므로 의 최대 우도 추정값은 AIC의 매개 변수 수를 동일하게 설정할 수 있습니다.X N T X ∼ N ( 0 , Σ ) Σ N ( N + 1 )
또는, PCA에서, 첫 번째 추출 할 수있는 고유 벡터와 고유 값 , 그들에게 전화 와 다음 계산 여기서 는 평균 잔차 분산입니다. 내 계산으로, 당신은 할 경우 요소를, 당신 것 의 매개 변수 , 에서 매개 변수 , 그리고 의 매개 변수 .Σ β f Λ f Σ = β f Λ f β ′ f + I σ 2 r σ 2 r f f Λ f N f β f 1 σ 2 r
이 방법이 맞습니까? 요인의 수가 증가함에 따라 최대 우도 접근 방식보다 더 많은 매개 변수를 유발하는 것처럼 보입니다 .