PCA에 K를 선택하는 방법은 무엇입니까? K는 투영 할 치수의 수입니다. 유일한 요구 사항은 너무 많은 정보를 잃지 않는 것입니다. 나는 그것이 데이터에 달려 있다는 것을 이해하지만 K를 선택할 때 고려해야 할 특성에 대한 간단한 일반적인 개요를 찾고 있습니다.
허용 가능한 데이터 손실 및 문제 설명에 따라 달라집니다!
—
Dawny33
아래 두 가지 답변에 동의합니다. 그러나 정보 손실을 정량화하는 간단한 방법, 즉 공분산 행렬의 SVD 대각선을 사용하는 간단한 방법이 있다는 것을 알고 있습니까?
—
yuqian