«tsne» 태그된 질문

T- 분산 확률 적 이웃 임베딩 (t-SNE)은 2008 년 van der Maaten과 Hinton이 도입 한 비선형 차원 감소 알고리즘입니다.

2
치수를 줄이기 위해 t-SNE의 매개 변수를 결정하는 방법은 무엇입니까?
나는 단어 임베딩에 매우 익숙하다. 학습 후 문서가 어떻게 보이는지 시각화하고 싶습니다. 나는 t-SNE가 그것을위한 접근법이라는 것을 읽었다. 포함 크기로 250 크기의 100K 문서가 있습니다. 사용 가능한 여러 패키지도 있습니다. 그러나 t-SNE의 경우 반복 횟수 나 알파 값 또는 퍼펙 스 빌리티 값을 더 잘 알고 있어야합니다. 이러한 하이퍼 파라미터입니까 …

1
PCA가 한 쌍의 큰 거리 만 보존한다는 것은 무엇을 의미합니까?
나는 현재 t-SNE 시각화 기술을 읽고 있으며 고차원 데이터를 시각화하기 위해 PCA (Principal Component Analysis)를 사용하는 단점 중 하나는 점 사이의 큰 쌍 거리를 유지한다는 것입니다. 고차원 공간에서 멀리 떨어져있는 의미 점은 저 차원 부분 공간에서도 멀리 떨어져 있지만 다른 모든 쌍방향 거리는 망칠 수 있습니다. 왜 그런지 이해하고 그래픽으로 …

1
연속 및 이진 변수가 혼합 된 t-SNE
현재 t-SNE를 사용하여 고차원 데이터의 시각화를 조사하고 있습니다. 이진 및 연속 변수가 혼합 된 일부 데이터가 있으며 이진 데이터를 너무 쉽게 클러스터링하는 것처럼 보입니다. 물론 이것은 스케일 된 (0과 1 사이) 데이터에 대해 예상됩니다. 유클리드 거리는 이진 변수 사이에서 항상 가장 크거나 작습니다. t-SNE를 사용하여 혼합 이진 / 연속 데이터 …

3
n, p가 둘 다 크면 PCA가 너무 느림 : 대안?
문제 설정 2D로 시각화하려고하는 높은 차원 (4096)의 데이터 포인트 (이미지)가 있습니다. 이를 위해 Karpathy의 다음 예제 코드 와 비슷한 방식으로 t-sne을 사용하고 있습니다. scikit 배우기 문서는 먼저 데이터의 차원을 낮추기 위해 PCA를 사용하는 것이 좋습니다 : 피처 수가 매우 많은 경우 차원 수를 적당한 양 (예 : 50)으로 줄이려면 다른 …

2
확장 가능한 치수 축소
기능의 수를 일정하게 고려하면 Barnes-Hut t-SNE 는O ( n 로그n )O(nlog⁡n)O(n\log n), 임의 예측 및 PCA는의 복잡성을O ( n )O(n)O(n) 매우 큰 데이터 세트에 "적절한"가격을 제공합니다. 반면에 다차원 스케일링에 의존하는 메소드 는O (엔2)O(n2)O(n^2) 복잡성. 다른 치수 축소 기술이 있습니까 (첫 번째를 보는 것처럼 사소한 기술을 제외하고) 케이kk 물론 열의 복잡도가 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.