PLS에서 회귀 계수에 대한 신뢰 구간을 계산하는 방법은 무엇입니까?


10

PLS 의 기본 모델은 주어진 행렬 Xn 벡터 yX = T P ' + E , y = T q ' + f 와 관련되어 있으며 , 여기서 T 는 잠복 n × k 행렬이며 E , f 는 노이즈 항입니다 ( X , y 가 중앙에 있다고 가정 ).n×mXny

X=TP+E,
y=Tq+f,
Tn×kE,fX,y

PLS의 추정 생산 에 '바로 가기'벡터 회귀 계수, 그리고, β 등이 Y ~ X β를 . 난의 분포 찾고 싶은 β를 아마 다음을 포함해야합니다 몇 가지 가정을 단순화, 아래 :T,P,qβ^yXβ^β^

  1. 모델은 정확하다. , 미지의 T , P , q에 대해 ;X=TP+E,y=Tq+fT,P,q
  2. 잠복 계수의 수 가 알려져 있으며 PLS 알고리즘에 사용됩니다.k
  3. 실제 오차 항은 알려진 분산의 iid 0 평균 법선입니다.

이 질문은 'the'PLS 알고리즘의 변형이 있기 때문에 다소 과소 평가되지만 그 결과는 받아 들일 것입니다. 또한의 분포를 추정하는 방법에 대한 지침 받아들이 β 를 통해 예를 들어 부트 스트랩을, 그러나 아마 그 별도의 질문입니다.β^

답변:


9

이 기사를 알고 있습니까 : PLS- 회귀 : 화학량 론의 기본 도구 ? PLS 매개 변수에 대한 SE 및 CI 도출은 §3.11에 설명되어 있습니다.

저는 일반적으로 예를 들어 Abdi, H에서 제안한 바와 같이 CI 계산을 위해 부트 스트랩에 의존합니다. 부분 최소 제곱 회귀 및 잠재 구조 회귀 (PLS 회귀)에 대한 투영 . Tenenhaus M. (1998) La régression PLS : Théorie et pratique (Technip) 에서 논의 된 이론적 해결책이 기억 나지만 책이 없어서 지금 확인할 수는 없습니다. 현재 로서는 plsRglm 과 같은 유용한 R 패키지가 있습니다.

PS 방금 plsdof R 패키지 와 관련하여 Nicole Krämer 의 기사를 발견했습니다 .


2

Reiss 의 논문을 발견했습니다 . 알. , 산업 종료 품질 예측에 대한 부분 최소 자승 신뢰 구간 계산은 다음과 같이 인용됩니다.

PLS 예측에는 예측 정확도를 나타 내기 위해 온라인 신뢰 구간이 수반되어야합니다. PLS 예측을위한 신뢰 구간의 공식화는“골드 표준”으로 결론을 내리지 않은 연구 분야입니다.

이 논문은 '이러한 작업에 대한 탁월한 조사', 다중 경로 PLS에 대한 표준 예측 오류 , Faber 및 Bro, Faber 및 Kowalski에 의한 논문, 주요 구성 요소 회귀 분석으로 얻은 예측 검증을위한 측정 오류 전파에 대한 참조를 포함합니다. 및 부분 최소 제곱 . 이 결과가 나올 때마다 요약하겠습니다 ...


(+1) 알게되어 감사합니다. Michel Tenenhaus의 작품을 다시 한 번 살펴 봐야합니다. sth가 흥미로울 경우 알려 드리겠습니다.
chl
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.