«pca» 태그된 질문

주성분 분석 (PCA)은 선형 차원 축소 기법입니다. 다변량 데이터 세트를 가능한 한 많은 정보 (많은 분산)를 유지하는 더 작은 구성 변수 세트로 줄입니다. 주성분이라고하는 이러한 변수는 입력 변수의 선형 조합입니다.

1
PCA, LDA, CCA 및 PLS
PCA, LDA, CCA 및 PLS는 어떤 관련이 있습니까? 그것들은 모두 "스펙트럼"과 선형 대수적이며 매우 잘 이해되어 있습니다 (예를 들어 50 년 이상의 이론이 세워져 있습니다). 그것들은 매우 다른 것들 (차원 축소를위한 PCA, 분류를위한 LDA, 회귀를위한 PLS)에 사용되지만 여전히 매우 밀접하게 관련되어 있다고 느낍니다.

5
주요 주성분은 어떻게 종속 변수에 대한 예측력을 유지할 수 있습니까 (또는 더 나은 예측으로 이어질 수 있습니까)?
회귀 실행한다고 가정하십시오 . 성분을 선택하여 왜 모델이 에 대한 예측력을 유지 합니까?k X YY∼XY∼XY \sim XkkkXXXYYY 차원 축소 / 기능 선택 관점에서 가 상위 고유 값을 가진 의 공분산 행렬의 고유 벡터 이면 는 상위 주요 구성 요소입니다 최대 분산으로. 따라서 우리는 의 피처 수를 줄이고 예측력의 대부분을 이해할 …

2
PCA와 LDA를 결합하는 것이 합리적입니까?
예를 들어 Bayes 분류기를 통해 감독 된 통계 분류 작업에 대한 데이터 집합이 있다고 가정합니다. 이 데이터 세트는 20 개의 피쳐로 구성되며 PCA (Principal Component Analysis) 및 / 또는 LDA (Linear Discriminant Analysis)와 같은 차원 축소 기법을 통해 2 가지 피쳐로 요약하려고합니다. 두 기술 모두 데이터를 더 작은 피쳐 하위 …

3
회귀 분석에서 능선 정규화 해석
최소 제곱 컨텍스트에서 능선 벌금에 관한 몇 가지 질문이 있습니다. βridge=(λID+X′X)−1X′yβridge=(λID+X′X)−1X′y\beta_{ridge} = (\lambda I_D + X'X)^{-1}X'y 1)이 식은 X의 공분산 행렬이 대각 행렬로 축소되었음을 나타냅니다. 즉, 변수가 절차 전에 표준화되었다고 가정하면 입력 변수 간의 상관 관계가 낮아집니다. 이 해석이 맞습니까? 2) 수축 적용 인 경우 정규화를 통해 람다를 어떻게 든 …

2
예측에 R prcomp 결과를 사용하는 방법은 무엇입니까?
800 obs가있는 data.frame이 있습니다. 40 개의 변수 중 하나이며 Principle Component Analysis를 사용하여 내 예측 결과를 향상 시키려고합니다 (지금까지는 15 가지 수동 변수에서 Support Vector Machine과 가장 잘 작동 함). prcomp가 예측 향상에 도움이 될 수 있음을 이해하지만 prcomp 함수의 결과를 사용하는 방법을 모르겠습니다. 결과를 얻습니다. > PCAAnalysis <- prcomp(TrainTrainingData, …
25 r  pca 

3
LSA 및 PCA (문서 클러스터링)
문서 클러스터링에 사용되는 다양한 기술을 조사하고 있으며 PCA (주요 구성 요소 분석) 및 LSA (잠재적 의미 분석)와 관련된 몇 가지 의문을 해결하고 싶습니다. 첫 번째-차이점은 무엇입니까? PCA에서 SVD 분해는 항 공분산 행렬에 적용되는 반면 LSA에서는 항 문서 행렬입니다. 다른 것이 있습니까? 둘째-문서 클러스터링 절차에서 그들의 역할은 무엇입니까? 지금까지 읽은 내용을 …

2
다중 공선 성에서 PCA가 불안정합니까?
회귀 상황에서 상관 관계가 높은 변수 세트가있는 경우 추정 계수의 불안정성으로 인해 일반적으로 "나쁜"것이라는 것을 알고 있습니다 (결정자는 0에 가까워짐에 따라 분산이 무한대로 진행됩니다). 내 질문은이 "나쁜 점"이 PCA 상황에서 지속되는지 여부입니다. 공분산 행렬이 특이 해짐에 따라 특정 PC의 계수 / 부하 / 무게 / 고유 벡터가 불안정하거나 임의 / …

5
분산이 적은 PC가“유용한”PCA의 예
일반적으로 PCA (Principal Component Analysis)에서는 데이터의 많은 변화를 설명하지 않기 때문에 처음 몇 대의 PC가 사용되고 저 분산 PC가 삭제됩니다. 그러나 저 변형 PC가 유용하고 (즉, 데이터의 맥락에서 사용하고, 직관적 인 설명 등이있는) 예를 버려서는 안되는 예가 있습니까?
24 pca 

2
“비선형 차원 축소”에서와 같이“비선형”을 이해하는 방법은 무엇입니까?
선형 차원 축소 방법 (예 : PCA)과 비선형 방법 (예 : Isomap)의 차이점을 이해하려고합니다. 나는이 맥락에서 비선형 성이 무엇을 의미하는지 이해할 수 없다. 나는 읽기 위키 백과 그 이에 비해 PCA (선형 차원 축소 알고리즘)를 사용하여 동일한 데이터 집합을 2 차원으로 줄이면 결과 값이 제대로 구성되지 않습니다. 이것은이 매니 폴드를 …

3
희소 PCA가 PCA보다 정확히 어떻게 더 좋습니까?
수업 전에 몇 가지 강의에서 PCA에 대해 배웠고이 매혹적인 개념에 대해 더 많이 알게되면서 희소 한 PCA에 대해 알게되었습니다. 내가 틀리지 않은지 물어보고 싶었다. 이것은 희소 한 PCA이다. PCA에서, 변수 를 가진 데이터 점이 있다면 , PCA를 적용하기 전에 차원 공간 에서 각 데이터 점을 나타낼 수있다 . PCA를 적용한 …

1
의존적 관찰을위한 PCA의 특성
우리는 일반적으로 PCA를 사례가 iid로 가정되는 데이터의 차원 축소 기술로 사용합니다. 질문 : 종속적이지 않은 IId 데이터에 PCA를 적용 할 때의 일반적인 뉘앙스는 무엇입니까? iid 데이터를 보유하고있는 PCA의 어떤 좋은 / 유용한 속성이 손상되거나 완전히 손실됩니까? 예를 들어, 데이터는 다변량 시계열 일 수 있으며,이 경우 자기 상관 또는 자기 회귀 …

2
PCA와 점근 적 PCA의 차이점은 무엇입니까?
1986 년 과 1988 년 두 논문에서 Connor와 Korajczyk는 자산 수익을 모델링하는 방법을 제안했습니다. 이러한 시계열은 일반적으로 기간 관측치보다 많은 자산을 가지므로 자산 수익률의 단면 공분산에 대해 PCA를 수행 할 것을 제안했습니다. 그들은이 방법을 Asymptotic Principal Component Analysis (APCA)라고 부릅니다. 관객은 PCA의 점근 적 특성을 즉시 생각하기 때문에 다소 혼란 …
23 pca  econometrics 

4
PCA에 대한 결 측값 대치
이 prcomp()함수를 사용하여 R에서 PCA (주성분 분석)를 수행했습니다. 그러나 해당 함수에 na.action매개 변수가 작동하지 않는 버그 가 있습니다. 나는 stackoverflow에 대한 도움을 요청했다 . 두 명의 사용자가 두 가지 방법으로 NA가치 를 처리했습니다 . 그러나 두 솔루션의 문제점은 NA값 이있을 때 해당 행이 삭제되고 PCA 분석에서 고려되지 않는다는 것입니다. 내 …

1
차원 수가 경우 데이터에 대해 주요 구성 요소 만있는 이유는 무엇 입니까?
PCA에서,시 치수의 개수 샘플 수 (또는 동일)보다 큰 , 이유는 기껏해야한다는 것이다 비제로 고유 벡터? 다시 말해, 차원 들 사이의 공분산 행렬의 순위 는 이다.N N - 1 d ≥ N N - 1디dd엔NN엔− 1N−1N-1디≥ Nd≥Nd\ge N엔− 1N−1N-1 예 : 샘플은 크기의 벡터화 된 이미지 이지만 이미지 만 있습니다 .N …

2
데이터의 SVD를 통해 PCA가 필요한 이유는 무엇입니까?
이 질문은 주요 구성 요소를 계산하는 효율적인 방법에 관한 것입니다. linear PCA의 많은 텍스트는 대소 문자 데이터 의 단일 값 분해를 사용하여 옹호 합니다 . 우리는 데이터가있는 경우 즉, 하고, 변수 (그 교체 할 열을 주요 구성 요소), 우리가 할 SVD : (제곱. 고유치의 뿌리), 특이 값의 주요 대각선을 점유은 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.