나는 전에 다음과 같은 표현을 들었다.
"최적화는 통계에서 모든 악의 근원"입니다.
예를 들어이 스레드 의 최상위 답변은 모델을 선택하는 동안 너무 적극적으로 최적화 할 위험에 대한 설명입니다.
내 첫 번째 질문은 다음과 같습니다.이 인용문은 특히 누구에게 귀속됩니까? (예 : 통계 문헌에서)
내가 이해 한 바에 따르면,이 진술은 과적 합의 위험을 나타냅니다. 전통적인 지혜는 적절한 교차 검증이 이미이 문제에 맞서 싸우고 있다고 말하지만,이 문제보다 더 많은 문제가있는 것 같습니다.
통계 전문가 및 ML 전문가는 엄격한 교차 검증 프로토콜 (예 : 100 개의 중첩 10 배 CV)을 준수 할 때에도 모델을 과도하게 최적화해야합니까? 그렇다면 "최고의"모델 검색을 언제 중지해야하는지 어떻게 알 수 있습니까?