«pca» 태그된 질문

주성분 분석 (PCA)은 선형 차원 축소 기법입니다. 다변량 데이터 세트를 가능한 한 많은 정보 (많은 분산)를 유지하는 더 작은 구성 변수 세트로 줄입니다. 주성분이라고하는 이러한 변수는 입력 변수의 선형 조합입니다.


1
단일 값 분해 (SVD)를 계산하는 효율적인 알고리즘은 무엇입니까?
주요 구성 요소 분석 에 관한 Wikipedia 기사에 따르면 행렬 X T X 를 형성하지 않고 의 SVD를 계산하기위한 효율적인 알고리즘이 존재하므로 SVD를 계산하는 것은 이제 소수의 구성 요소 만 필요하지 않는 한 데이터 매트릭스에서 주요 구성 요소 분석을 계산하는 표준 방법입니다.XXXXTXXTXX^TX 기사에서 말하는 효율적인 알고리즘이 무엇인지 말해 줄 수 …
17 pca  algorithms  svd  numerics 

1
강력한 방법이 실제로 더 낫습니까?
나는 각각 약 400의 크기와 약 300 개의 예측 변수를 가진 두 그룹의 주제 A와 B를 가지고 있습니다. 내 목표는 이진 반응 변수에 대한 예측 모델을 구축하는 것입니다. 고객은 A에서 B로 작성된 모델을 적용한 결과를보고 싶어합니다. 그의 저서 "Regression Modeling Strategies"에서 @FrankHarrell은 두 개의 데이터 세트를 결합하고 그에 대한 모델을 …


3
주성분 분석“뒤로”: 주어진 선형 변수 조합에 의해 얼마나 많은 데이터 차이가 설명됩니까?
6 가지 변수 AAA , BBB , CCC , DDD , EEE 및 F에 대한 주성분 분석을 수행했습니다 FF. 올바르게 이해하면 회전하지 않은 PC1은 이러한 변수의 선형 조합이 데이터에서 가장 큰 차이를 설명 / 설명하고 PC2는 이러한 변수의 선형 조합이 데이터에서 다음으로 가장 큰 차이를 설명하는 방식을 알려줍니다. 그냥 궁금 …

1
이상치 탐지를위한 강력한 PCA 및 강력한 Mahalanobis 거리
강력한 PCA ( Candes et al 2009 또는 Netrepalli et al 2014에서 개발 한 )는 다변량 이상치 탐지에 널리 사용되는 방법 이지만 , 공분산 행렬의 강력하고 규칙적인 추정을 통해 Mahalanobis 거리를 이상치 탐지에도 사용할 수 있습니다 . 한 방법을 다른 방법으로 사용하는 것의 장점에 대해 궁금합니다. 내 직감에 따르면 둘 …

1
Biplot / loading 플롯에서 PCA 구성 요소와 변수의 적절한 연관 측정은 무엇입니까?
FactoMineR측정 데이터 세트를 잠재 변수로 줄이기 위해 사용 하고 있습니다. 내가 해석하는 위의 변수 맵은 분명하지만, 변수의지도를 찾고 변수와 구성 요소 1 사이의 연관에 올 때 나는 혼란 스러워요, ddp그리고 cov매우 가까운 맵의 구성 요소이며, ddpAbs조금 더있다 떨어져. 그러나 이것은 상관 관계가 보여주는 것이 아닙니다. $Dim.1 $Dim.1$quanti correlation p.value jittAbs …

2
주성분 분석을 수행하기 전에 데이터를 로그 변환하는 이유는 무엇입니까?
PCA에 대한 이해를 높이려면 http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/ 튜토리얼을 따르십시오 . 학습서는 Iris 데이터 세트를 사용하고 PCA 이전에 로그 변환을 적용합니다. [1] 세트에 의해 제안 공지 다음 코드에서는 연속 변수 로그 변환을 적용하는 것이 center와 scale동일 TRUE하도록 호출 prcomp전에 PCA를 적용하여 변수의 표준화. 누군가 Iris 데이터 세트의 처음 네 열에서 로그 함수를 먼저 …

1
다변량 가우스 데이터의 PCA 구성 요소가 통계적으로 독립적입니까?
데이터가 다변량 정규 분포 인 경우 PCA 구성 요소 (주요 구성 요소 분석)가 통계적으로 독립적입니까? 그렇다면 어떻게 이것을 증명 / 증명할 수 있습니까? 이 게시물을 보았으므로 질문에 답변합니다. PCA는 명시 적 가우스 성 가정을하지 않습니다. 데이터에 설명 된 분산을 최대화하는 고유 벡터를 찾습니다. 주성분의 직교성은 가능한 가장 많은 데이터 변동을 …
16 pca  independence  svd 

2
지도에서 공간 및 시간적 상관 관계 표시
미국 전역의 기상 관측소 네트워크에 대한 데이터가 있습니다. 이것은 날짜, 위도, 경도 및 일부 측정 값을 포함하는 데이터 프레임을 제공합니다. 데이터가 하루에 한 번 수집되고 지역 규모의 날씨에 의해 구동된다고 가정합니다 (아니, 우리는 그 논의에 참여하지 않을 것입니다). 동시에 측정 된 값이 시간과 공간에서 어떻게 상관되는지 그래픽으로 보여주고 싶습니다. 저의 …

2
차원 축소를 클러스터링과 언제 결합합니까?
문서 수준 클러스터링을 수행하려고합니다. 용어 문서 주파수 행렬을 구성했으며 k- 평균을 사용하여 이러한 고차원 벡터를 군집화하려고합니다. 직접 클러스터링 대신, 먼저 LSA (Latent Semantic Analysis) 특이 벡터 분해를 적용하여 U, S, Vt 행렬을 구하고, scree plot을 사용하여 적절한 임계 값을 선택하고 축소 된 행렬에 클러스터링을 적용했습니다 (특히 Vt 그것은 나에게 좋은 …

2
설문지의 신뢰성 평가 : 차원, 문제가있는 항목 및 알파, 람다 6 또는 기타 색인 사용 여부?
실험에 참석 한 참가자의 점수를 분석하고 있습니다. 제품에 대한 참가자의 태도를 추정하기위한 6 가지 항목으로 구성된 설문지의 신뢰성을 추정하고 싶습니다. 모든 항목을 단일 스케일 (알파는 약 0.6)로 처리하고 한 번에 한 항목을 삭제하는 경우 (최대 알파는 약 0.72) Cronbach의 알파를 계산했습니다. 항목의 수와 기본 구성의 차원에 따라 알파가 과소 평가되거나 …

3
PCA 점수 해석
누구든지 PCA 점수를 해석하는 데 도움을 줄 수 있습니까? 내 데이터는 곰에 대한 태도에 관한 설문에서 나온 것입니다. 로딩에 따르면, 나는 주요 구성 요소 중 하나를 "곰 공포"로 해석했습니다. 해당 주요 구성 요소의 점수가 각 응답자가 해당 주요 구성 요소까지 측정하는 방식과 관련이 있습니까 (긍정적이든 부정적이든).
16 pca 

1
부분 최소 제곱, 감소 된 순위 회귀 및 주요 구성 요소 회귀 간의 연결은 무엇입니까?
감소 된 순위 회귀 및 주성분 회귀는 부분 최소 제곱의 특별한 경우입니까? 이 튜토리얼 (6 페이지의 "목표 비교")에서는 X 또는 Y를 투영하지 않고 부분 최소 제곱을 수행 할 때 (즉, "부분이 아님") 해당 등급이 감소하거나 주성분 회귀가 감소한다고 설명합니다. 이 SAS 설명서 페이지 , "감소 된 순위 회귀"및 "방법 간의 …

2
R의 캐럿 패키지에서 PCA 및 k- 폴드 교차 검증
방금 Coursera의 기계 학습 과정에서 강의를 다시 보았습니다. 교수는지도 학습 응용 프로그램의 전처리 데이터에 대한 PCA에 대해 논의하는 섹션에서 PCA는 훈련 데이터에 대해서만 수행되어야하며 매핑은 교차 검증 및 테스트 세트를 변환하는 데 사용됩니다. PCA 및 열차 / 시험 분할 도 참조하십시오 . 그러나 caretR 패키지에서 train()함수에 전달한 학습 데이터 는 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.