크로스 밸리데이션 외부에서 하이퍼 파라미터 튜닝을 수행하면 성능을 측정하는 데 사용하는 데이터 세트가 기능을 튜닝하는 데 사용한 것과 동일하므로 바이어스 유효성이 높은 외부 유효성 추정치가 발생할 수 있습니다.
내가 궁금한 것은 이것이 얼마나 나쁜 문제인지 입니다. 튜닝 할 매개 변수가 매우 많기 때문에 기능 선택이 실제로 얼마나 나쁜지 이해할 수 있습니다. 그러나 LASSO (하나의 매개 변수 만 있고 정규화 강도가 있음) 또는 기능 선택이없는 임의 포리스트 (소수 기능은 추가 할 수 있지만 노이즈 기능을 추가 / 제거하는 것만 큼 극적은 아님)와 같은 것을 사용하는 경우 어떻게해야합니까?
이 시나리오에서 훈련 오류 추정치가 얼마나 낙관적 일 것으로 예상 할 수 있습니까?
이 사례 연구, 논문, 일화, 기타 정보에 감사드립니다. 감사합니다!
편집 : 명확히하기 위해 훈련 데이터에 대한 모델 성능 추정에 대해 이야기하고 있지 않습니다 (예 : 교차 유효성 검사를 전혀 사용하지 않음). "교차 검증 외부의 하이퍼 파라미터 튜닝"이란 각 개별 모델의 성능을 추정하기 위해서만 크로스 밸리데이션을 사용하지만 하이퍼 파라미터 튜닝 절차 내에서 과적 합을 보정하기 위해 외부의 두 번째 크로스 밸리데이션 루프를 포함 하지 않는 것을 의미합니다. 훈련 과정에서 과적 합). 예를 들어 여기에 답변을 참조 하십시오 .