«pca» 태그된 질문

주성분 분석 (PCA)은 선형 차원 축소 기법입니다. 다변량 데이터 세트를 가능한 한 많은 정보 (많은 분산)를 유지하는 더 작은 구성 변수 세트로 줄입니다. 주성분이라고하는 이러한 변수는 입력 변수의 선형 조합입니다.

3
PCA 최적화는 볼록합니까?
PCA (Principal Component Analysis)의 목적 함수는 L2 규범의 재구성 오류를 최소화하는 것입니다 ( 여기 섹션 2.12 참조) . 또 다른 관점은 투영의 분산을 최대화하려고 시도하는 것입니다. 또한 PCA의 목적 함수는 무엇입니까? ? ). 내 질문은 PCA 최적화 볼록한 것입니까? (나는 여기서 몇 가지 토론을 찾았 지만 누군가가 이력서에 대한 좋은 …

3
기능 수를 줄일 수있을 때 PCA를 사용하여 학습 알고리즘의 속도를 높이는 이유는 무엇입니까?
머신 러닝 과정에서 PCA ( Principal Component Analysis ) 의 일반적인 용도 중 하나 는 다른 머신 러닝 알고리즘의 속도를 높이는 것입니다. 예를 들어 로지스틱 회귀 모델을 학습한다고 가정합니다. 1에서 n까지 i에 대한 훈련 세트 가 있고 벡터 x의 치수가 매우 크다는 것을 알 수 있습니다 (치수를 말하십시오) .PCA를 사용하여 …


4
AIC (또는 BIC)를 사용한 PCA 모델 선택
AKA (Akaike Information Criterion)를 사용하여 PCA에서 추출 할 적절한 수의 요소를 선택하고 싶습니다. 유일한 문제는 매개 변수 수를 결정하는 방법을 잘 모르겠다는 것입니다. 행렬 고려하십시오. 여기서 은 변수 수를 나타내고 는 관측치 수를 나타냅니다. 예를 들어 입니다. 공분산 행렬이 대칭이므로 의 최대 우도 추정값은 AIC의 매개 변수 수를 동일하게 설정할 …

2
PCA 및 임의 포리스트
최근의 Kaggle 경쟁을 위해, 나는 (수동으로) 내 훈련 세트에 대해 10 개의 추가 기능을 정의했으며,이 기능은 임의의 숲 분류기를 훈련시키는 데 사용됩니다. 새로운 기능으로 데이터 세트에서 PCA를 실행하여 서로 비교하는 방법을 확인하기로 결정했습니다. 분산의 ~ 98 %가 첫 번째 성분 (첫 번째 고유 벡터)에 의해 전달됨을 발견했습니다. 그런 다음 분류기를 …

5
PCA를 사용하여 군집 분석을위한 변수 선택을 수행 할 수 있습니까?
군집 분석을 수행하려면 변수 수를 줄여야합니다. 내 변수는 서로 밀접하게 관련되어 있으므로 요인 분석 PCA (주성분 분석) 를 수행 하는 것으로 생각했습니다 . 그러나 결과 점수를 사용하면 클러스터가 정확하지 않습니다 (문헌의 이전 분류와 비교). 질문: 회전 행렬을 사용하여 각 구성 요소 / 인자에 대해 가장 큰 부하를 갖는 변수를 선택하고 …

2
요인 분석 의 첫 번째 요인은 무엇을 최대화합니까?
주성분 분석에서 첫 번째 kkk 주성분 은 최대 분산을 갖는 kkk 직교 방향입니다. 즉, 제 1 주성분은 최대 분산의 방향으로 선택되고, 제 2 주성분은 최대 분산을 갖는 제 1 방향과 직교하는 방향으로 선택된다. 요인 분석에 대한 유사한 해석이 있습니까? 예를 들어, 첫 번째 요인은 원래 상관 행렬 의 비대 각 …

2
주성분 분석을 사용하여 회귀 변수를 선택하는 방법은 무엇입니까?
현재 주성분 분석을 사용하여 모델링에 사용할 변수를 선택하고 있습니다. 현재 실험에서 A, B 및 C를 측정합니다. 정말로 알고 싶은 것은 : 시간과 노력을 절약하기 위해 더 적은 측정을하고 C 및 / 또는 B 기록을 중단 할 수 있습니까? 내 데이터의 분산의 60 %를 차지하는 첫 번째 주요 구성 요소에 3 …

1
PCA의 Scikit-learn 구현과 TruncatedSVD의 차이점
대수 / 정확한 수준에서 주성분 분석과 특이 값 분해 간의 관계를 이해합니다. 내 질문은 scikit-learn 구현 에 관한 것 입니다. " [TruncatedSVD]는 PCA와 매우 유사하지만 공분산 행렬 대신 샘플 벡터에서 직접 작동합니다. "는 두 방법의 대수적 차이를 반영합니다. " 추정자 [TruncatedSVD]는 두 개의 알고리즘을 지원합니다. 빠른 무작위 SVD 솔버와 ARPACK을 …
12 pca  scikit-learn  svd  scipy 

2
주요 구성 요소의 수를 판별하기 위해 PCA에 대한 교차 유효성 검증을 수행하는 방법은 무엇입니까?
주요 구성 요소 분석, PCA에 대한 자체 함수를 작성하려고합니다 (물론 이미 많이 작성되었지만 직접 구현하는 데 관심이 있습니다). 내가 만난 주요 문제는 교차 검증 단계와 예측 제곱합 (PRESS)을 계산하는 것입니다. 어떤 교차 유효성 검사를 사용하든 중요하지 않은 이론에 대한 질문이지만 LOOCV (Leave-One-Out Cross-Validation)를 고려하십시오. LOOCV를 수행하려면 다음과 같은 이론이 필요하다는 …

4
거리 매트릭스만으로 PCA 수행
페어 단위 거리 만있는 거대한 데이터 세트를 클러스터하고 싶습니다. k-medoids 알고리즘을 구현했지만 실행하는 데 시간이 너무 오래 걸리므로 PCA를 적용하여 문제의 차원을 줄이는 것으로 시작하고 싶습니다. 그러나이 방법을 수행하는 유일한 방법은 내 상황에없는 공분산 행렬을 사용하는 것입니다. 쌍별 거리 만 알고 PCA를 적용 할 수있는 방법이 있습니까?

2
PCA 솔루션은 독특합니까?
특정 데이터 세트에서 PCA를 실행할 때 솔루션이 고유합니까? 즉, 인터 포인트 거리를 기반으로 2D 좌표 세트를 얻습니다. 이러한 제약 조건을 충족하는 포인트의 배열을 하나 이상 찾을 수 있습니까? 대답이 예라면 어떻게 다른 해결책을 찾을 수 있습니까?
12 pca 

4
매우 높은 차원의 데이터에 대해 PCA를 수행하는 방법은 무엇입니까?
주성분 분석 (PCA)을 수행하려면 데이터에서 각 열의 평균을 빼고 상관 계수 행렬을 계산 한 다음 고유 벡터와 고유 값을 찾아야합니다. 오히려 상관 관계 계수 행렬 (corrcoef)을 찾는 방법으로 높은 차원의 배열을 사용할 수 없기 때문에 작은 행렬에서만 작동한다는 점을 제외하고는 파이썬에서 구현 한 것입니다. 이미지에 이미지를 사용해야하므로 현재 구현이 실제로 …
12 pca  python 


1
PCA와 PLS에서 "로드"와 "상호로드"의 차이점은 무엇입니까?
PCA (Principal Component Analysis)를 수행 할 때 공통적으로 수행해야 할 한 가지는 변수 간의 관계를 조사하기 위해 서로에 대해 두 개의 하중을 플로팅하는 것입니다. 주성분 회귀 및 PLS 회귀를 수행하기위한 PLS R 패키지 와 함께 제공되는 논문 에는 상관 부하 그림 (종이의 그림 7 및 15 페이지 참조) 이라는 다른 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.