이것들은 세 가지 다른 방법이며, 그중 어느 것도 다른 경우의 특별한 경우로 볼 수 없습니다.
형식적 경우 및 Y가 집중되어 예측기 ( N × P )과 응답 ( N × Q ) 데이터 집합 및 우리 축의 첫 번째 쌍 보면 승 ∈ R의 P 에 대한 X 및 V ∈ R의 Q 에 대한 Y 그리고, 이들 방법을 다음 수량을 최대화하십시오.XYn×pn×qw∈RpXv∈RqY
P C A :R R R :P L S :C C A :바르( X w )바르( X w ) ⋅코르2( X w , Y v ) ⋅ Var( Y의 V )바르( X w ) ⋅ 코르2( X w , Y v ) ⋅ Var( Y v ) = Cov2(Xw,Yv)Var(Xw)⋅Corr2(Xw,Yv)
(이 목록에 표준 상관 분석 (CCA)을 추가했습니다.)
SAS에서는 세 가지 방법이 모두 PROC PLS
다른 매개 변수를 가진 동일한 기능 을 통해 구현되는 것처럼 보이기 때문에 혼동이 의심 됩니다. 따라서 SAS 기능의 이름이 지정 되었기 때문에 세 가지 방법 모두 PLS의 특수한 경우 인 것 같습니다. 그러나 이것은 불행한 이름입니다. 실제로 PLS, RRR 및 PCR은 어떤 이유로 인해 SAS에서 하나의 기능으로 구현되는 세 가지 방법입니다 PLS
.
당신이 연결 한 두 튜토리얼은 실제로 그것에 대해 매우 분명합니다. 않는 세 가지 방법의 프리젠 테이션 튜토리얼 상태 목표 페이지 6 하지 PLS 말은 당신이 당신의 질문에있어서 무엇을 RRR 또는 PCR, 반대로 "가됩니다." 마찬가지로, SAS 문서는 공식과 직관을 제공하는 세 가지 방법이 다르다고 설명합니다.
[P] 주성분 회귀 분석은 가능한 한 많은 예측 변수 변동을 설명하는 요인을 선택하고 감소 된 순위 회귀 분석은 최대한 많은 반응 변동을 설명하는 요인을 선택하며 부분 최소 제곱은 두 목표의 균형을 조정하여 반응 및 예측 변수 변동을 모두 설명하는 요인을 찾습니다. .
SAS 문서에는 세 가지 방법이 다른 솔루션을 제공하는 훌륭한 장난감 예제를 보여주는 그림도 있습니다. 이 장난감 예제에는 두 개의 예측 변수 과 x 2 와 하나의 반응 변수 y가 있습니다. 방향 X 가장 상관 관계가 Y는 의 최대 변화의 방향에 직교하도록 발생 X . 따라서 PC1은 첫 번째 RRR 축에 직교하고 PLS 축은 중간에 있습니다.x1x2yXyX
RRR 손실 함수에 능선 페널티를 추가하여 능선 감소 순위 회귀 또는 RRRR을 얻을 수 있습니다. 이렇게하면 회귀 축이 PC1 방향으로 당겨지며 PLS가 수행하는 것과 다소 유사합니다. 그러나 RRRR의 비용 함수는 PLS 양식으로 작성할 수 없으므로 서로 다릅니다.
y