다중 회귀 분석을 수행 할 때 왜 역 제거가 정당화됩니까?


9

과적 합을 초래하지 않습니까? 분석의 일부로 잭 나이프 또는 부트 스트랩 절차를 추가하면 내 결과가 더 신뢰할 수 있습니까?


8
정당하다고 누가 말합니까? 물론 그것은 과적 합으로 이어져야합니다.
gung-모니 티 복원

2
amazon.com/Statistics-Explained-Introductory-Guide-Scientists/… 와 같은 많은 책에서 실제로 제안됩니다 (여전히?) . 나는 같은 문제를 스스로 생각하고있다. 여러 회귀 분석을 도입 할 때 과적 합 문제를 전혀 다루지 않는 통계 책이 3-4 개 이상 있다고 생각합니다.
mmh

5
솔직히 입문 통계 책이 과적 합과 과잉 테스트에 대해 논의하지 않는다면 다른 책을 읽게 될 것입니다.
Matthew Drury

3
후진 제거 (및 전진 선택)는 피쳐 선택 기준으로 ONE-ONE-OUT 교차 검증 (예 : PRESS)을 사용하는 경우 여전히 과적 합하는 경향이 있습니다.
Dikran Marsupial

5
@mmh는 입문이 아니지만 Frank Harrell의 Regression Modeling Strategies 의 4 장을 읽는 것이 좋습니다. 글을 읽을 가치가있는 4 장뿐만 아니라이 부분은 특히이 토론과 관련이 있습니다.
Glen_b-복지국 모니카

답변:


2

나는 모델을 만들고 테스트하는 것이 다른 것이라고 생각합니다. 후진 제거는 모델 구축의 일부입니다. 잭 나이프와 부트 스트랩이 테스트에 더 많이 사용됩니다.

부트 스트랩과 잭 나이프를 사용하면 단순한 역류 제거보다 확실하게 추정 할 수 있습니다. 그러나 과적 합을 실제로 테스트하려면 궁극적 인 테스트는 분할 샘플, 일부 훈련, 다른 시험입니다. Leave-one-out은이 목적으로 너무 불안정하거나 신뢰할 수 없습니다 : http://www.russpoldrack.org/2012/12/the-perils-of-leave-one-out.html

모델의 견고성에 대한보다 안정적인 추정치를 얻으려면 적어도 10 %의 피험자가 필요하다고 생각합니다. 그리고 당신이 20 과목을 가지고 있다면, 2 과목은 여전히 ​​매우 적습니다. 그러나 나머지 인구 집단에 적용 할 수있는 모형을 만들기에 충분한 표본이 있는지에 대한 의문이 생깁니다.

그것이 적어도 부분적으로 귀하의 질문에 대답하기를 바랍니다.


따라서 교차 검증을 사용할 수 있습니다. k<n (또는 k<<n)?
mmh

통계 학습 입문 에서는 5 장의 리샘플링 (검증 세트, 여러 그룹과의 교차 검증, 부트 스트랩) 및 6 장의 모델 선택에 대한 다양한 접근 방식에 대해 설명합니다.
EdM
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.