«pca» 태그된 질문

주성분 분석 (PCA)은 선형 차원 축소 기법입니다. 다변량 데이터 세트를 가능한 한 많은 정보 (많은 분산)를 유지하는 더 작은 구성 변수 세트로 줄입니다. 주성분이라고하는 이러한 변수는 입력 변수의 선형 조합입니다.

1
lmer 모델에 사용할 다중 비교 방법 : lsmeans 또는 glht?
하나의 고정 효과 (조건)와 두 개의 임의 효과 (대상 내 설계 및 쌍으로 인해 참가자)가있는 혼합 효과 모델을 사용하여 데이터 세트를 분석하고 있습니다. lme4패키지로 모델이 생성되었습니다 exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). 다음으로, 고정 효과 (조건)없이 모형에 대해이 모형의 우도 비 검정을 수행했으며 유의 한 차이가 있습니다. 내 데이터 세트에는 3 가지 조건이 있으므로 다중 …

1
일반 PCA와 확률 적 PCA의 차이점은 무엇입니까?
정기적 인 PCA가 관측 된 데이터에 대한 확률 모델을 따르지 않는다는 것을 알고 있습니다. PCA와 PPCA 의 기본적인 차이점은 무엇 입니까? PPCA 잠복 변수 모델에는 예를 들어 관측 변수 , 잠복 (관찰되지 않은 변수 ) 및 정규 PCA에서와 같이 직교하지 않아도 되는 행렬 가 포함됩니다. 정규 PCA에 대해 생각할 수있는 …
15 pca 

2
PCA / FA에서 유지되는 여러 주요 구성 요소 또는 요소에서 단일 색인 작성
PCA (Principal Component Analysis)를 사용하여 연구에 필요한 색인을 만듭니다. 내 질문은 PCA를 통해 계산 된 유지 주요 구성 요소를 사용하여 단일 인덱스를 작성하는 방법입니다. 예를 들어 PCA를 사용한 후 3 가지 주요 구성 요소를 유지하기로 결정했으며이 3 가지 주요 구성 요소에 대한 점수를 계산했습니다. 각 응답자에 대해이 3 점 만점에 …

1
설정의 회귀 : 정규화 방법 (올가미, PLS, PCR, 융기)을 선택하는 방법은 무엇입니까?
나는 갈 수 있는지 여부를 확인하려 능선 회귀 , LASSO , 주성분 회귀 (PCR), 또는 부분 최소 제곱 변수 / 기능 (의 수가 많은 경우 상황에서 (PLS) ppp ) 및 샘플의 작은 수 ( n<pn<pn np>10np>10np>10n 변수 ( 및 Y )는 서로 다른 각도로 서로 관련 되어 있습니다.XXXYYY 내 질문은이 …


5
여러 회귀 분석을 사용하여 여러 다른 PC에서 하나의 주성분 (PC)을 예측할 수 있습니까?
얼마 전 R-help 메일 링리스트의 사용자가 회귀에서 PCA 점수를 사용하는 건전성에 대해 물었습니다. 사용자는 일부 PC 점수를 사용하여 다른 PC의 변형을 설명하려고합니다 (자세한 내용은 여기 참조 ). 대답은 아니요, PC가 서로 직교하기 때문에 소리가 들리지 않는다는 것입니다. 누군가 이것이 왜 더 자세하게 설명 할 수 있습니까?
15 regression  pca 

1
이후 분석을 수행하기 위해 PCA가 캡처 한 분산이 필요한가?
11 개의 변수가있는 데이터 세트가 있으며 데이터를 줄이기 위해 PCA (직교)가 수행되었습니다. 두 가지 주요 구성 요소 (PC)가 데이터를 설명하기에 충분하고 나머지 구성 요소는 정보가 충분하지 않다는 주제와 스 크리 플롯 (아래 참조)에 대한 내 지식을 유지하기 위해 구성 요소의 수를 결정하는 것이 분명했습니다. 병렬 분석을 사용한 스 크리 플롯 …
15 variance  pca 

4
어떤 변수가 어떤 PCA 구성 요소를 설명합니까?
이 데이터를 사용하여 : head(USArrests) nrow(USArrests) 다음과 같이 PCA를 수행 할 수 있습니다. plot(USArrests) otherPCA <- princomp(USArrests) 나는 새로운 구성 요소를 얻을 수 있습니다 otherPCA$scores 구성 요소가 설명하는 분산 비율 summary(otherPCA) 그러나 어떤 변수가 주로 어떤 주성분으로 설명되는지 알고 싶다면 어떻게해야합니까? 그리고 그 반대의 경우도 마찬가지입니다 : 예를 들어 PC1 …

1
상호 정보 매트릭스의 고유 벡터의 의미는 무엇입니까?
공분산 행렬의 고유 벡터를 볼 때 최대 분산의 방향을 얻습니다 (첫 번째 고유 벡터는 데이터가 가장 많이 변하는 방향 등입니다). 이를 주성분 분석 (PCA)이라고합니다. 상호 정보 매트릭스의 고유 벡터 / 값을 보는 것이 무엇을 의미하는지 궁금합니다. 최대 엔트로피 방향을 가리킬까요?

1
“인자 분석의 기본 정리”는 PCA에 어떻게 적용됩니까? 또는 PCA 로딩은 어떻게 정의됩니까?
저는 현재 "인자 분석"(PCA)에 대한 슬라이드 세트를 사용하고 있습니다. 여기에서 분석에 들어가는 데이터의 상관 행렬 ( )을 인자 로딩 행렬 ( A )을 사용하여 복구 할 수 있다고 주장하는 "인자 분석의 기본 정리"가 도출됩니다 .RR\bf RAA\bf A R=AA⊤R=AA⊤\bf R = AA^\top 그러나 이것은 나를 혼란스럽게합니다. PCA에서 "인자 로딩"의 행렬은 데이터의 …

2
Bartlett 's Test로 진단 된 구 형성이 PCA가 부적절하다는 것을 의미하는 이유는 무엇입니까?
Bartlett 's Test는 표본이 분산이 같은 모집단에서 추출한 것인지 결정하는 데 관심이 있음을 이해합니다. 표본이 분산이 동일한 모집단에서 추출 된 경우 검정의 귀무 가설을 기각 할 수 없으므로 주성분 분석이 부적절합니다. 이 상황에서 문제가 어디에 있는지 확실하지 않습니다 (동성 데이터 세트가 있음). 모든 데이터의 기본 분포가 동일한 데이터 세트의 문제점은 …


1
PCA biplot의 화살표는 무엇을 의미합니까?
다음 PCA biplot을 고려하십시오. library(mvtnorm) set.seed(1) x <- rmvnorm(2000, rep(0, 6), diag(c(5, rep(1,5)))) x <- scale(x, center=T, scale=F) pc <- princomp(x) biplot(pc) 많은 빨간색 화살표가 그려져 있습니다. 무슨 의미입니까? "Var1"이라는 레이블이 붙은 첫 번째 화살표는 데이터 세트의 가장 다양한 방향을 가리켜 야한다는 것을 알고있었습니다 (만약 데이터가 2000 개의 데이터 포인트라고 …
14 r  pca  linear-algebra  biplot 

3
PCA에서 얻은 내용을 어떻게 해석 할 수 있습니까?
대학 배정의 일환으로 상당히 큰 다변량 (> 10) 원시 데이터 세트에서 데이터 사전 처리를 수행해야합니다. 나는 어떤 의미에서 통계학자가 아니므로, 무슨 일이 일어나고 있는지에 대해 약간 혼란스러워합니다. 아마도 재미 있고 간단한 질문이 무엇인지 사전에 사과합니다. 다양한 답변을보고 통계에 대해 이야기 한 후 머리가 돌고 있습니다. 나는 그것을 읽었다 : PCA를 …
14 pca 

2
CLR (중앙 로그 비율 변환)을 사용하여 PCA에 대한 데이터를 준비 할 수 있습니까?
스크립트를 사용하고 있습니다. 핵심 레코드입니다. 주어진 깊이 (열의 첫 번째 열)에 대한 열의 다른 원소 구성을 보여주는 데이터 프레임이 있습니다. PCA를 수행하고 싶습니다. 선택해야하는 표준화 방법이 혼란 스럽습니다. clr()귀하를 위해 데이터를 준비하기 위해 를 사용한 사람이 prcomp()있습니까? 아니면 내 솔루션을 방해합니까? 에서 scale 속성을 사용하는 것 외에도 함수를 clr()사용하기 전에 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.