t-SNE를 적용하기 전에 데이터를 중앙에 맞추고 스케일링해야합니까?


18

내 데이터의 일부 기능은 큰 값을 갖는 반면 다른 기능은 훨씬 작은 값을 갖습니다.

t-SNE를 적용하기 전에 더 큰 값을 향한 편향을 방지하기 위해 데이터를 중앙에 + 스케일해야합니까?

기본 유클리드 거리 측정법으로 Python의 sklearn.manifold.TSNE 구현을 사용합니다.

답변:


18

알고리즘은 점 사이의 거리에서만 작동하기 때문에 센터링은 중요하지 않지만 2 차원이 큰 차이를 갖는 차원의 영향을 더 많이 받기 때문에 다른 차원을 동일한 중요성으로 처리하려면 크기 조정이 필요합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.