«multidimensional-scaling» 태그된 질문

관찰되거나 계산 된 (비) 유사성을 물체간에 저 차원 공간 (일반적으로 유클리드)의 거리로 렌더링하는 기법입니다. 따라서 데이터의 차원을 구성합니다. 객체는 해당 차원에서 플롯되고 개념화 될 수 있습니다.


3
모델 검증 전 또는 모델 검증 내에서 기능 정규화를 수행합니까?
머신 러닝의 일반적인 모범 사례는 예측 변수의 특징 정규화 또는 데이터 표준화를 수행하는 것입니다. 즉, 평균을 빼고 데이터를 중심에두고 분산 (또는 표준 편차도)으로 나누어 정규화하는 것입니다. 자립과 이해를 위해 두 가지 주요 목표를 달성하기 위해이 작업을 수행합니다. 수치 적 안정성을 위해 작은 모델 중량을 피하십시오. 컨쥬 게이트 그라디언트 (Conjugate Gradient)와 …

7
신경망의 데이터 정규화 및 표준화
신경망 (ANN)을 사용하여 복잡한 시스템의 결과를 예측하려고합니다. 결과 (종속) 값의 범위는 0에서 10,000 사이입니다. 입력 변수마다 범위가 다릅니다. 모든 변수는 대략 정규 분포를 갖습니다. 훈련 전에 데이터를 확장하는 다른 옵션을 고려합니다. 한 가지 옵션은 각 변수의 평균 및 표준 편차 값을 독립적으로 사용하여 누적 분포 함수 를 계산 하여 입력 …

3
LASSO에 대한 인디케이터 / 바이너리 / 더미 예측 변수의 재조정 여부
LASSO (및 다른 모델 선택 절차)의 경우 예측 변수를 재조정하는 것이 중요합니다. 일반 추천 I 추적은 연속 변수의 0 평균, 1 개 표준 편차의 정상화를 사용하는 것입니다. 그러나 인형과 어떤 관련이 있습니까? 예를 들어 , 동일한 (우수한) 여름 학교의 일부 적용 예 는 연속 변수를 0과 1 사이로 조정하지만 (이상치에는 …

1
t-SNE 대 MDS
최근 t-SNE ( t-Distributed Stochastic Neighbor Embedding ) 에 대한 질문을 읽고 MDS ( Multidimensional Scaling )에 대한 질문도 방문했습니다 . 그것들은 종종 유사하게 사용되므로 여기에 별도로 (또는 PCA 와 비교하여 ) 둘 다에 많은 질문이 있음을 보는 것이 좋습니다 . 요컨대 t-SNE와 MDS의 차이점은 무엇입니까? 예. 그들이 탐구하는 데이터 …

5
스트리밍 데이터 용 t-SNE 버전이 있습니까?
t-SNE 와 Barnes-Hut 근사에 대한 나의 이해는 모든 힘 상호 작용이 동시에 계산되고 각 점이 2d (또는 낮은 차원) 맵에서 조정될 수 있도록 모든 데이터 점이 필요하다는 것입니다. 스트리밍 데이터를 효율적으로 처리 할 수있는 t-sne 버전이 있습니까? 따라서 관측치가 한 번에 하나씩 도착하면 2d 맵에서 가장 좋은 위치를 찾아서 새 …

3
현대 통계에서 MDS의 역할은 무엇입니까?
최근에 다차원 스케일링을 경험했습니다. 이 도구와 현대 통계에서의 역할을 더 잘 이해하려고합니다. 다음은 몇 가지 안내 질문입니다. 어떤 질문에 대답합니까? 어떤 연구자들이 종종 그것을 사용하는데 관심이 있습니까? 비슷한 기능을 수행하는 다른 통계 기법이 있습니까? 어떤 이론이 그 주위에서 개발 되었습니까? "MDS"는 "SSA"와 어떤 관련이 있습니까? 이러한 혼합 / 조직화되지 않은 …

1
RandomForest-MDS 플롯 해석
나는 randomForest를 사용하여 8 가지 변수 (다른 신체 자세와 움직임)를 기반으로 6 가지 동물 행동 (예 : 서기, 걷기, 수영 등)을 분류했습니다. randomForest 패키지의 MDSplot 은이 출력을 제공하며 결과를 해석하는 데 문제가 있습니다. 나는 동일한 데이터에 대해 PCA를 수행했으며 PC1과 PC2의 모든 클래스 사이에서 이미 좋은 분리를 얻었지만 Dim1과 Dim2는 …

4
거리 매트릭스만으로 PCA 수행
페어 단위 거리 만있는 거대한 데이터 세트를 클러스터하고 싶습니다. k-medoids 알고리즘을 구현했지만 실행하는 데 시간이 너무 오래 걸리므로 PCA를 적용하여 문제의 차원을 줄이는 것으로 시작하고 싶습니다. 그러나이 방법을 수행하는 유일한 방법은 내 상황에없는 공분산 행렬을 사용하는 것입니다. 쌍별 거리 만 알고 PCA를 적용 할 수있는 방법이 있습니까?


2
2D로 다차원 데이터 (LSI) 시각화
나는 문서 간의 유사성을 찾기 위해 잠재 의미 색인을 사용하고 있습니다 ( 감사, JMS를! ) 차원 축소 후에 문서를 클러스터로 그룹화하기 위해 k- 평균 군집화를 시도했지만 매우 효과적입니다. 그러나 조금 더 나아가서 두 노드 사이의 거리가 유사성에 반비례하는 노드 세트로 문서를 시각화하고 싶습니다 (매우 유사한 노드는 서로 가깝습니다). 내 데이터가 …

2
확장 가능한 치수 축소
기능의 수를 일정하게 고려하면 Barnes-Hut t-SNE 는O ( n 로그n )O(nlog⁡n)O(n\log n), 임의 예측 및 PCA는의 복잡성을O ( n )O(n)O(n) 매우 큰 데이터 세트에 "적절한"가격을 제공합니다. 반면에 다차원 스케일링에 의존하는 메소드 는O (엔2)O(n2)O(n^2) 복잡성. 다른 치수 축소 기술이 있습니까 (첫 번째를 보는 것처럼 사소한 기술을 제외하고) 케이kk 물론 열의 복잡도가 …

1
ReLU 뉴런에 대한 입력 정규화
LeCun et al (1998)의 "Efficient Backprop"에 따르면 모든 입력이 0을 중심으로하고 최대 2 차 미분의 범위 내에 있도록 모든 입력을 정규화하는 것이 좋습니다. 예를 들어 "Tanh"함수에 [-0.5,0.5]를 사용합니다. 이것은 Hessian이 더욱 안정적이됨에 따라 역 전파 진행을 돕는 것입니다. 그러나, 나는 정류기 뉴런 (max (0, x))으로 무엇을 해야할지 확신하지 못했습니다. (그 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.