PCA에 대한 몇 가지 빠른 질문이 있습니다.
- PCA 는 데이터 세트가 가우스 인 것으로 가정 합니까 ?
- 본질적으로 비선형 데이터에 PCA를 적용하면 어떻게됩니까?
데이터 세트가 주어지면 프로세스는 먼저 평균 정규화, 분산을 1로 설정하고 SVD를 취하고 순위를 줄이고 마지막으로 데이터 세트를 새로운 감소 된 순위 공간에 매핑합니다. 새로운 공간에서 각 차원은 최대 분산의 "방향"에 해당합니다.
- 그러나 새 공간에서 해당 데이터 집합의 상관 관계는 항상 0입니까, 아니면 기본적으로 가우시안 데이터에만 해당됩니까?
"A"와 "B"라는 두 개의 데이터 세트가 있다고 가정합니다. 여기서 "A"는 가우시안에서 가져온 무작위로 샘플링 된 점에 해당하고 "B"는 다른 분포에서 무작위로 샘플링 된 점 (예 : 포아송)에 해당합니다.
- PCA (A)와 PCA (B)를 어떻게 비교합니까?
- 새 공간의 점을 보면 PCA (A)가 가우시안에서 샘플링 된 점에 해당하고 PCA (B)가 포아송에서 샘플링 된 점에 해당하는지 어떻게 알 수 있습니까?
- "A"0의 점들의 상관 관계는 무엇입니까?
- "B"의 포인트 상관도 0입니까?
- 더 중요한 것은 "올바른"질문입니까?
- 상관 관계를 살펴 봐야합니까, 아니면 고려해야 할 다른 지표가 있습니까?