PLS 회귀와 PLS 경로 모델링의 차이점 PLS의 비판


12

이 질문은 여기 에서 요청 되었지만 아무도 좋은 대답을하지 못했습니다. 다시 시작하는 것이 좋습니다. 또한 의견 / 질문을 더 추가하고 싶습니다.

  • 첫 번째 질문은 "PLS 경로 모델링"과 "PLS 회귀"의 차이점은 무엇입니까? 좀 더 일반화하기 위해 구조식 모델링 (SEM), 경로 모델링 및 회귀는 무엇입니까? SEM 초점이 응답과 예측 변수 사이의 관계에 있고 경로 모델링이 SEM의 특별한 경우 인 반면 회귀는 예측에 더 중점을 둡니다.

  • 두 번째 질문은 PLS가 얼마나 신뢰할 만합니까? 최근 Rönkkö et al. 에서 강조된 바와 같이 많은 비판을 받고있다 . 2016Rönkkö et al. 2015 년 에는 Journal of Operations Management 와 같은 상위 계층 저널에서 PLS를 기반으로 한 논문이 거부됩니다 ( 여기 에서 저널 편집자 참고 사항).

    우리는 PLS 기반 원고를 거의 거부하고있다. PLS가 예외없이 OM 연구자들이 사용하는 모델의 모델에서 잘못된 모델링 접근법이라고 결론을 내렸기 때문이다 .

    내 분야는 분광학이며 관리 / 심리학이나 통계가 아닙니다. 위의 논문에서 저자들은 SEM 방법으로 PLS에 대해 더 많이 이야기하고 있지만 저에게 비판은 PLS 회귀에도 적용됩니다.


귀하의 링크는 모두 월페이퍼 뒤에 있습니다.
Jeremy Miles

당신은 절대적으로 옳다! 죄송합니다. PDF 파일이 있지만 업로드하거나 공유 할 수 있는지 잘 모르겠습니다. 과학은 자유로 워야한다 :)
Ress

PLS 회귀는 stats.stackexchange.com/questions/179733 에서 매우 상세하게 설명되고 논의됩니다 . 불행히도 나는 "경로 모델링"에 대해 아무것도 모른다.
amoeba

나는 "경로 모델링은"SEM에 대한 또 다른 이름입니다 생각
rep_ho

2016 년 논문에서 : "PLS가 SEM이라고 주장하면서 PLS 광택에 대한 대부분의 입문 텍스트는 PLS가 SEM이라고 주장하므로 합성물과의 회귀에 비해 이점을 제공해야합니다 (예 : Gefen et al., 2011). 종종 PLS 자체도 단순히 합성물과의 회귀라고 명시하지 않습니다. " 오해의 소지가 있습니다. 저자가 SEM이 순수한 이론적 구성이어야한다고 주장하고 경험적으로 도출 된 구조 방정식에 대한 경멸을 가지고 있는지 논증의 주된 견해는 알 수있다. 그러나 PLS는 공분산을 통해 '구조화 된'방정식을 도출했습니다.
ReneBt

답변:


9

첫 번째 질문은 "PLS 경로 모델링"과 "PLS 회귀"의 차이점은 무엇입니까?

그들은 동의어입니다.

좀 더 일반화하기 위해 구조식 모델링 (SEM), 경로 모델링 및 회귀는 무엇입니까? SEM 초점이 응답과 예측 변수 사이의 관계에 있고 경로 모델링이 SEM의 특별한 경우 인 반면 회귀는 예측에 더 중점을 둡니다.

SEM은 회귀의 한 형태입니다. 회귀는 독립 변수와 종속 변수를 서로 연관시키는 방법이며 별도의 엔터티로 처리되는 여러 변수를 사용하는 방법을 포함합니다. SEM은 특히 변수 간의 수학적 관계를 사용하여 최종 모델을 구속합니다. PLS의 경우 공분산입니다. 내 이해는 경로 모델링이 특정 도메인이라는 용어입니다 (내가 아니라 나는 당신과 같은 분광학 자입니다).

두 번째 질문은 PLS가 얼마나 신뢰할 만합니까? 최근 Rönkkö et al.에서 강조된 바와 같이 많은 비판을 받고있다. 2016 및 Rönkkö et al. 2015 년

훌륭한 반박이에서 발견된다 Henseler 외 알. 2013 PLS에 대한 일반적인 믿음과 현실 . Rönkkö et al.의 주요 관심사. PLS는 일반적인 잠재 요소를 가정하는 일부 상황에서 성능이 좋지 않다는 것입니다. PLS는 실제로 여러 잠재 요소를 처리하도록 설계되었으며, 실제 상황에서 훨씬 더 일반적인 상황입니다.

얼마나 신뢰할 만합니까? 분광학의 경우 훌륭한 도구이지만 한계가 있습니다. 여러 가지 기본 요소의 기여를 포착하는 복잡한 모델을 구축 할 수 있으므로 과적 합의 위험이 있습니다. 이러한 이유로 조심해서 사용해야하며 적절한 외부 검증이 필수적이지만 이러한 경고는 모든 모델 구축 도구에 적용됩니다. 나는 주로 20 년 동안 실제 데이터 세트를 연구하고 의존 변수를 뒷받침하는 하나의 공통 요인 (데이터 또는 과학 이론에 근거하지 않은)을 가진 실험 데이터 세트를 경험하지 못했습니다.


1
이 답변에 Ronkko et al.에 대한 자세한 내용이 있기를 바랍니다. vs Henseler et al. 불쾌한 일. 나는 전혀 분광학자가 아니지만 선형 회귀에 대한 정규화 방법으로 PLS에 대해 비교적 잘 이해하고 있습니다 ( Hastie 등 의 통계 학습의 요소에 제시 된 방법 입니다). 화학 측정에서는 PLS1이라고합니다. 여기서 "성능"은 재구성 오류와 관련이 있으며, 교차 유효성 검사를 사용하여 정규화 강도 등을 선택할 수 있습니다. 이는 능선 회귀 또는 PCR 또는 이와 유사한 것을 겪은 모든 사람에게 매우 친숙한 설정입니다.
amoeba

[계속] 여러 종속 변수가있는 PLS2도 알고 있지만 이것이 얼마나 자주 사용되는지 잘 모르겠습니다. 동시에 Ronkko et al. 즉, "SEM"의 초점은 독점적으로 다중 X를 다중 Y와 연관시키는 것 (PLS2인가?)에 있으며 Y의 예측보다는 X와 Y의 관계를 해석하는 데 더 많은 것으로 보인다. 나는 그들이 "성능"이라는 것이 무엇을 의미하는지조차 확신하지 못하며, 그들이 PLS를 비판 할 때 그들이 PLS 대신 에 어떤 것을 선호하는지 전혀 모른다 .
amoeba

ReneBT와 amoeba에게 감사합니다. 나는 레딧에이 질문을 게시 여기에 누군가 (soumya_ray)는 회귀 분석 및 SEM는 근본적으로 다른 것을 대답했다. 그녀는 기술적 차이점을 설명하지 않았습니다. Btw, 그녀의 대답은 당신이 말한 것에 반합니다 (당신의 대답은 나에게 의미가 있습니다).
Ress

Btw, PLS를 사용하여 대역을 선택합니다. PLS 성능에 대한 당신의 요점을 확인하지만, 좋은 예측 (테스트 및 교정 모두)을 초래할 수 있지만 모델은 예측 변수를 관련이없는 중요한 변수로 선택하기 때문에 근본적으로 잘못되었거나 해석하기가 매우 어려울 수 있습니다 반응 변수.
Ress

저자가 제기 한 주요 문제에 대한 추가 의견은 "PLS 알고리즘은 가중치를 생성하여 데이터에서 상관 관계를 사용하여 시작점으로 사용 된 단위 가중 합성물과 비교하여 인접 합성물 간의 상관 관계를 증가시킵니다. "전세계 최적의 달성을 보장하지 않습니다". 간단히 말해서, 모델이 동일한 기본 공분산 구조를 가진 모집단에만 적용된다는 의미입니다. 이는 PLS를 무효화하지는 않지만주의해서 모델을 작성하고 사용해야한다는 것을 의미합니다.
ReneBt
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.