«pca» 태그된 질문

주성분 분석 (PCA)은 선형 차원 축소 기법입니다. 다변량 데이터 세트를 가능한 한 많은 정보 (많은 분산)를 유지하는 더 작은 구성 변수 세트로 줄입니다. 주성분이라고하는 이러한 변수는 입력 변수의 선형 조합입니다.

1
Biplot과 관련한 PCA 및 통신 분석
Biplot은 주로 주성분 분석 (및 관련 기술)의 결과를 표시하는 데 사용됩니다 . 구성 요소 로딩 과 구성 요소 점수를 동시에 보여주는 이중 또는 오버레이 산점도 입니다. 나는 오늘 @amoeba에 의해 biplot 좌표가 어떻게 생성 / 확대되는지에 대한 질문에 대한 나의 의견에서 벗어나는 대답을 주었다고 알려졌다. 그의 대답 은 몇 가지 …

2
PCA가 분산을 설명하는 동안 요인 분석은 공분산을 어떻게 설명합니까?
다음은 Bishop의 "패턴 인식 및 기계 학습"책, 12.2.4 "인자 분석"에서 인용 한 내용입니다. 강조 표시된 부분에 따르면, 요인 분석 은 행렬 변수 간 ​​공분산을 캡처합니다WWW . 나는 어떻게 궁금해 ? 내가 이해하는 방법은 다음과 같습니다. 말 관측 인 , 차원 변수 인자 로딩 매트릭스이며, 계수 스코어 벡터이다. 그러면 이 있습니다. …

3
PCA 또는 FA에서 점수 또는 하중 표시는 의미가 있습니까? 부호를 뒤집을 수 있습니까?
두 가지 다른 함수 ( prcomp및 princomp)를 사용하여 R을 사용하여 주성분 분석 (PCA)을 수행 했으며 PCA 점수가 다른 것으로 나타났습니다. 어떻게 할 수 있습니까? 이걸 고려하세요: set.seed(999) prcomp(data.frame(1:10,rnorm(10)))$x PC1 PC2 [1,] -4.508620 -0.2567655 [2,] -3.373772 -1.1369417 [3,] -2.679669 1.0903445 [4,] -1.615837 0.7108631 [5,] -0.548879 0.3093389 [6,] 0.481756 0.1639112 [7,] 1.656178 …
36 r  pca  factor-analysis 

3
PCA의 선형성
그러나 PCA는 선형 절차로 간주됩니다. P C A (X) ≠ P C A ( X1) + P C A ( X2) + … + P C A ( X엔) ,피기음에이(엑스)≠피기음에이(엑스1)+피기음에이(엑스2)+…+피기음에이(엑스엔),\mathrm{PCA}(X)\neq \mathrm{PCA}(X_1)+\mathrm{PCA}(X_2)+\ldots+\mathrm{PCA}(X_n), 여기서 입니다. 이는 데이터에 대해 PCA에 의해 획득 된 고유 벡터 행렬이라고한다 데이터의 합에 의해 얻어진 PCA 고유 벡터를 …
35 pca  linear 

3
PCA와 열차 / 시험 분할
이진 레이블 집합이 여러 개인 데이터 집합이 있습니다. 각 레이블 집합에 대해 분류기를 훈련시켜 교차 유효성 검사로 평가합니다. 주성분 분석 (PCA)을 사용하여 차원을 줄이려고합니다. 내 질문은 : 전체 데이터 세트에 대해 PCA를 한 번 수행 한 다음 위에서 설명한대로 교차 검증에 더 낮은 차원의 새 데이터 세트를 사용할 수 있습니까? …

3
t-SNE가 군집화 또는 분류를위한 차원 축소 기술로 사용되지 않는 이유는 무엇입니까?
최근 과제에서 MNIST 숫자에 PCA를 사용하여 크기를 64 (8 x 8 이미지)에서 2로 줄이라는 지시를 받았습니다. 그런 다음 가우스 혼합 모델을 사용하여 숫자를 클러스터링해야했습니다. 2 개의 주요 구성 요소 만 사용하는 PCA는 별개의 군집을 생성하지 않으므로 모델이 유용한 그룹화를 생성 할 수 없습니다. 그러나 2 개의 구성 요소와 함께 t-SNE를 …

1
Factor Analysis / PCA에서 회전을 수행 한 이유와 적절한 회전을 선택하는 직관적 인 이유는 무엇입니까?
내 질문 요인 분석 (또는 PCA의 구성 요소)에서 요인의 회전을 수행하는 직관적 인 이유는 무엇입니까? 변수가 최상위 구성 요소 (또는 요인)에 거의 똑같이로드되면 구성 요소를 구별하기가 어렵다는 것을 이해합니다. 따라서이 경우 회전을 사용하여 구성 요소를 더 잘 차별화 할 수 있습니다. 이 올바른지? 회전을하면 어떤 결과가 발생합니까? 이것은 어떤 영향을 …

1
PCA가 k- 평균 군집 분석에 어떻게 도움이됩니까?
배경 : 도시의 주거 지역을 주택 단위 밀도, 인구 밀도, 녹지 면적, 주택 가격, 학교 수 / 보건소 / 보육 센터 등 사회 경제적 특성에 따라 그룹으로 분류하고 싶습니다. 주거 지역을 몇 개의 다른 그룹으로 나눌 수 있는지, 그리고 그들의 독특한 특징은 무엇인지 이해하고 싶습니다. 이 정보는 도시 계획을 용이하게 …

3
상관 관계 또는 공분산에 대한 PCA : 상관 관계에 대한 PCA는 의미가 있습니까? [닫은]
주성분 분석 (PCA)에서 공분산 행렬 또는 상관 행렬을 선택하여 성분을 찾을 수 있습니다 (각 고유 벡터에서). 두 행렬 사이의 고유 벡터가 같지 않기 때문에 서로 다른 결과 (PC 로딩 및 점수)를 제공합니다. 내 이해는 이것이 원시 데이터 벡터 와 표준화 가 직교 변환을 통해 연관 될 수 없기 때문에 발생한다는 …

1
PCA 목적 함수 : 분산 최대화와 오류 최소화 간의 관계는 무엇입니까?
PCA 알고리즘은 상관 행렬의 관점에서 공식화 될 수 있습니다 (데이터 XXX 가 이미 정규화되었고 첫 번째 PC 로의 투영 만 고려하고 있다고 가정 ). 목적 함수는 다음과 같이 작성할 수 있습니다. maxw(Xw)T(Xw)s.t.wTw=1.maxw(Xw)T(Xw)s.t.wTw=1. \max_w (Xw)^T(Xw)\; \: \text{s.t.} \: \:w^Tw = 1. 이것은 괜찮습니다. 우리는 Lagrangian multipliers를 사용하여 문제를 해결합니다. maxw[(Xw)T(Xw)−λwTw],maxw[(Xw)T(Xw)−λwTw], \max_w …
32 pca  optimization 

3
PCA를 능가하기 위해 Tensorflow에서 자동 인코더 구축
신경망으로 데이터의 차원을 줄이는 데있어 Hinton과 Salakhutdinov는 과학 2006 은 딥 오토 인코더를 사용하여 비선형 PCA를 제안했습니다. Tensorflow를 사용하여 PCA 자동 인코더를 빌드하고 훈련하려고 시도했지만 선형 PCA보다 더 나은 결과를 얻을 수 없었습니다. 자동 인코더를 효율적으로 훈련시킬 수있는 방법은 무엇입니까? (@amoeba의 나중에 편집 :이 질문의 원래 버전에는 올바르게 작동하지 않는 …

1
큰 희소 행렬의 차원 축소 (SVD 또는 PCA)
/ 편집 : 추가 후속 조치 irlba :: prcomp_irlba를 사용할 수 있습니다 / 편집 : 내 자신의 게시물에 후속. irlba이제 "center"및 "scale"인수를 사용하여이를 사용하여 기본 구성 요소를 계산할 수 있습니다. 예 : pc <- M %*% irlba(M, nv=5, nu=0, center=colMeans(M), right_only=TRUE)$v Matrix기계 학습 알고리즘에 사용하려는 크고 작은 기능이 있습니다. library(Matrix) …

5
많은 독립 변수에서 유의 한 예측 변수 탐지
겹치지 않는 두 인구 (환자 및 건강, 총 ) 의 데이터 세트 에서 연속 종속 변수에 대한 중요한 예측 변수 ( 독립 변수 중) 를 찾고 싶습니다 . 예측 변수 사이의 상관 관계가 있습니다. 나는 예측 변수 중 어느 것이 종속 변수를 가능한 정확하게 예측하기보다는 "실제로"종속 변수와 관련이 있는지 알아내는 …

3
백만 PCA 버전 시각화
주요 구성 요소 분석의 결과를 요약 테이블보다 더 많은 통찰력을 제공하는 방식으로 시각화 할 수 있습니까? ~ 1e4와 같이 관측 수가 많을 때 가능합니까? 그리고 R [다른 환경에서도 환영]에서 할 수 있습니까?

4
R에서 PCA를 사용하여 차원 축소를 수행하는 방법
큰 데이터 집합이 있고 차원 축소를 수행하고 싶습니다. 이제 어디서나 PCA를 사용할 수 있다는 것을 읽었습니다. 그러나 여전히 PCA를 계산 / 수행 한 후해야 할 일을 찾지 못하는 것 같습니다. R에서는이 명령을 사용하여 쉽게 수행 할 수 있습니다 princomp. 그러나 PCA를 계산 한 후 어떻게해야합니까? 처음 주요 구성 요소 를 …
30 r  pca 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.