«tsne» 태그된 질문

T- 분산 확률 적 이웃 임베딩 (t-SNE)은 2008 년 van der Maaten과 Hinton이 도입 한 비선형 차원 감소 알고리즘입니다.

6
t-SNE 출력에 대한 클러스터링
클러스터 내에서 하위 그룹 효과를 찾기 전에 시끄러운 데이터 세트를 클러스터링하는 것이 편리한 응용 프로그램이 있습니다. 먼저 PCA를 살펴 봤지만 변동성의 90 %에 도달하기 위해서는 ~ 30 개의 구성 요소가 필요하므로 단지 몇 대의 PC에서 클러스터링하면 많은 정보가 버려집니다. 그런 다음 t-SNE (처음으로)를 시도했는데, 이는 k- 평균을 통한 군집화에 매우 …

3
PCA가 t-SNE보다 더 적합한 경우가 있습니까?
7 가지 텍스트 수정 동작 (텍스트 수정 시간, 키 입력 횟수 등)이 서로 어떤 관련이 있는지 확인하고 싶습니다. 측정 값은 서로 관련되어 있습니다. PCA를 실행하여 측정 값이 PC1 및 PC2에 어떻게 투영되는지 확인하여 측정 값간에 별도의 양방향 상관 관계 테스트를 실행하는 것을 피할 수있었습니다. 일부 측정 값 간의 관계가 비선형 …
39 pca  tsne 

1
t-SNE 목적 함수에서 교차 엔트로피가 아닌 Kullback-Leibler 발산을 사용하는 이유는 무엇입니까?
제 생각에는 샘플 분포에서 실제 분포로의 KL 발산은 단순히 크로스 엔트로피와 엔트로피의 차이입니다. 많은 기계 학습 모델에서 교차 엔트로피를 사용하여 비용 함수로 사용하지만 t-sne에서 Kullback-Leibler 분기를 사용하는 이유는 무엇입니까? 학습 속도에 차이가 있습니까?

2
t-SNE는 언제 오도합니까?
저자 중 한 사람으로부터 인용 : t- 분산 스토캐스틱 이웃 임베딩 (t-SNE)은 차원 축소를위한 ( 상을 수상한 ) 기법으로, 특히 고차원 데이터 세트의 시각화에 매우 적합합니다. 꽤 들리지만 저자가 말하는 것입니다. 저자의 또 다른 인용문 (앞서 언급 한 경쟁) : 이 경쟁에서 무엇을 빼앗 았습니까? 데이터에 대한 예측 변수를 교육하기 …

3
t-SNE가 군집화 또는 분류를위한 차원 축소 기술로 사용되지 않는 이유는 무엇입니까?
최근 과제에서 MNIST 숫자에 PCA를 사용하여 크기를 64 (8 x 8 이미지)에서 2로 줄이라는 지시를 받았습니다. 그런 다음 가우스 혼합 모델을 사용하여 숫자를 클러스터링해야했습니다. 2 개의 주요 구성 요소 만 사용하는 PCA는 별개의 군집을 생성하지 않으므로 모델이 유용한 그룹화를 생성 할 수 없습니다. 그러나 2 개의 구성 요소와 함께 t-SNE를 …

4
R을 사용한 치수 축소에서 t-SNE 대 PCA의 문제점은 무엇입니까?
336x256 부동 소수점 수 (336 박테리아 게놈 (열) x 256 정규화 테트라 뉴클레오티드 빈도 (행)의 행렬을 가지고 있습니다 (예 : 모든 열은 1을 더합니다). 원리 성분 분석을 사용하여 분석을 실행할 때 좋은 결과를 얻습니다. 먼저 데이터에서 kmeans 클러스터를 계산 한 다음 PCA를 실행하고 2D 및 3D의 초기 kmeans 클러스터링을 기반으로 …
27 r  pca  tsne 

3
t-SNE를 통해 시각화를위한 차원 축소가 "닫힌"문제로 간주되어야합니까?
차원 축소를위한 sne티티t 알고리즘에 대해 많이 읽었습니다 . MNIST와 같은 "클래식"데이터 세트의 성능에 깊은 인상을 받았습니다. MNIST는 숫자를 명확하게 구분합니다 ( 원본 기사 참조 ). 또한 훈련하는 신경망에서 배운 기능을 시각화하는 데 사용했으며 결과에 매우 만족했습니다. 그래서 내가 이해하는 것처럼 : -sne은 대부분의 데이터 세트에서 좋은 결과를 얻었 으며 Barnes-Hut …

1
t-SNE 대 MDS
최근 t-SNE ( t-Distributed Stochastic Neighbor Embedding ) 에 대한 질문을 읽고 MDS ( Multidimensional Scaling )에 대한 질문도 방문했습니다 . 그것들은 종종 유사하게 사용되므로 여기에 별도로 (또는 PCA 와 비교하여 ) 둘 다에 많은 질문이 있음을 보는 것이 좋습니다 . 요컨대 t-SNE와 MDS의 차이점은 무엇입니까? 예. 그들이 탐구하는 데이터 …

5
스트리밍 데이터 용 t-SNE 버전이 있습니까?
t-SNE 와 Barnes-Hut 근사에 대한 나의 이해는 모든 힘 상호 작용이 동시에 계산되고 각 점이 2d (또는 낮은 차원) 맵에서 조정될 수 있도록 모든 데이터 점이 필요하다는 것입니다. 스트리밍 데이터를 효율적으로 처리 할 수있는 t-sne 버전이 있습니까? 따라서 관측치가 한 번에 하나씩 도착하면 2d 맵에서 가장 좋은 위치를 찾아서 새 …

1
t-SNE를 적용하기 전에 데이터를 중앙에 맞추고 스케일링해야합니까?
내 데이터의 일부 기능은 큰 값을 갖는 반면 다른 기능은 훨씬 작은 값을 갖습니다. t-SNE를 적용하기 전에 더 큰 값을 향한 편향을 방지하기 위해 데이터를 중앙에 + 스케일해야합니까? 기본 유클리드 거리 측정법으로 Python의 sklearn.manifold.TSNE 구현을 사용합니다.

3
분류를 위해 T-SNE를 사용하여 하이퍼 파라미터 선택
(경쟁)으로 작업하는 특정 문제로 21 가지 기능 ([0,1]에서 숫자) 및 이진 출력이라는 다음 설정이 있습니다. 약 100K 행이 있습니다. 설정이 시끄 럽습니다. 나와 다른 참가자는 잠시 동안 기능 생성을 적용하고이 설정에서는 t- 분산 확률 론적 이웃 임베딩이 다소 강력한 것으로 나타났습니다. 나는 "t-SNE를 효과적으로 사용하는 방법"이라는 글을 우연히 발견 했지만 …

1
t-SNE에서 축의 의미는 무엇입니까?
나는 현재 t-SNE 수학 주위로 머리를 감싸려고합니다 . 불행히도, 여전히 만족스럽게 대답 할 수없는 질문이 하나 있습니다 : t-SNE 그래프에서 축의 실제 의미는 무엇입니까? 이 주제에 대한 프레젠테이션을하거나 출판물에 포함시킬 경우 : 축에 적절한 레이블을 어떻게 지정합니까? 추신 : 나는 이 Reddit 질문을 읽었 지만 거기에 주어진 대답 (예 : …

1
t-SNE가 클래스를 잘 분리한다는 것을 알면 어떤 분류 알고리즘을 사용해야합니까?
분류 문제가 있다고 가정하고 처음에는 데이터에서 통찰력을 얻고 t-SNE를 수행한다고 가정 해 봅시다. t-SNE의 결과는 클래스를 잘 분리합니다. 이것은 클래스를 아주 잘 분리하는 분류 모델을 만들 수 있음을 의미합니다 (t-SNE가 잘 분리되지 않으면 많은 것을 암시하지 않습니다). t-SNE는 로컬 구조에 중점을두고 클래스를 잘 분리 할 수 ​​있다는 것을 알고 있습니다.이 …



당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.