데이터 시각화를 제외하고 t-SNE의 유용한 용도는 무엇입니까?


12

어떤 상황에서 데이터 시각화를 제외하고 t-SNE를 사용해야합니까?

T-SNE는 치수 축소에 사용됩니다. 이 질문에 대한 답 은 t-SNE는 시각화에만 사용해야하며 클러스터링에는 사용하지 않아야한다는 것을 나타냅니다. 그렇다면 t-SNE의 좋은 사용법은 무엇입니까?


6
클러스터는 복잡성에 매우 의존하기 때문에 표준 조언은 클러스터링에 tsne을 사용하지 않는 것입니다. "시각화"에만 사용해야합니다. 그러나 tsne 플롯을 볼 때 클러스터를 즉시 찾고 볼 수 있기 때문에 그것은 나에게 분명하지 않습니다. 따라서 귀하의 질문은 좋은 것입니다 : tsne은 무엇입니까?
generic_user

2
내가 요청한이 질문에 대한 답변을 참조하십시오 : stats.stackexchange.com/questions/263539/…
generic_user

@generic_user가 말했듯이 시각화 옆에 t-sne의 이점을 알고 싶습니다.
wolfe

왜 이것이 복제본으로 폐쇄되었는지 모르겠습니다. OP는 시각화와는 별개로 t-sne의 유용한 사용법을 묻고 있습니다. 연결된 스레드는 모두 클러스터링에 관한 것입니다. 그러나 다른 용도가있을 수 있습니다.
amoeba

답변:


4

에 대한 대답 이 질문은 t-SNE는 시각화를 위해 우리가해야 사용되어야한다는 것을 시사 하지 클러스터링을 위해 사용합니다. 그렇다면 t-SNE의 좋은 사용법은 무엇입니까?

나는이 결론에 동의하지 않습니다. t-SNE가 다른 클러스터링 알고리즘보다 보편적으로 더 나쁘다고 가정 할 이유없습니다 . 모든 클러스터링 알고리즘은 데이터 구조에 대한 가정을하며, 기본 분포 및 축소 된 차원의 최종 사용에 따라 다르게 수행 될 것으로 예상 할 수 있습니다.

많은 비지도 학습 알고리즘과 같은 t-SNE는 종종 데이터를 분리 할 수 ​​있는지 여부에 대한 조기 통찰력 확보, 데이터가 식별 가능한 구조가 있는지 테스트 및이 구조의 특성을 검사하는 수단을 제공합니다. 이러한 질문에 대한 답변을 시작하기 위해 t-SNE 출력을 시각화 할 필요 가 없습니다 . 저 차원 임베딩의 다른 응용은 예측 방법의 성능을 향상시키기 위해 다중 공선 성을 제거하거나 분류하기위한 특징을 구축하는 것을 포함한다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.