최근 과제에서 MNIST 숫자에 PCA를 사용하여 크기를 64 (8 x 8 이미지)에서 2로 줄이라는 지시를 받았습니다. 그런 다음 가우스 혼합 모델을 사용하여 숫자를 클러스터링해야했습니다. 2 개의 주요 구성 요소 만 사용하는 PCA는 별개의 군집을 생성하지 않으므로 모델이 유용한 그룹화를 생성 할 수 없습니다.
그러나 2 개의 구성 요소와 함께 t-SNE를 사용하면 클러스터가 훨씬 더 잘 분리됩니다. Gaussian Mixture Model은 t-SNE 구성 요소에 적용될 때 더 뚜렷한 군집을 생성합니다.
MNIST 데이터 세트에 변환이 적용된 다음 이미지 쌍에서 2 개의 구성 요소가있는 PCA와 2 개의 구성 요소가있는 t-SNE의 차이를 확인할 수 있습니다.
나는 t-SNE 가이 답변 과 같은 고차원 데이터의 시각화에만 사용되지만, 생성 된 별개의 클러스터를 고려할 때 왜 분류 모델에 사용되거나 차원 모델로 사용되는 차원 축소 기술로 사용되지 않는지 읽었습니다. 독립형 클러스터링 방법?