분류 문제에 대해 두 가지 학습 방법 와 가 있으며 반복적 인 교차 유효성 검사 또는 부트 스트랩과 같은 일반화 성능을 추정한다고 가정하십시오. 이 과정에서 나는 이러한 반복에서 각 방법에 대한 점수 와 의 분포를 얻 (예 : 각 모델에 대한 ROC AUC 값의 분포).
이러한 분포를 보면 있지만 (즉, 의 예상 일반화 성능 이 보다 높지만 이 추정에 대한 불확실성이 더 있습니다).
이것이 회귀 분석 의 편향-분산 딜레마 라고 생각합니다 .
와 를 비교 하고 어떤 모델을 사용 대한 정확한 결정을 내리기 위해 어떤 수학적 방법 을 사용할 수 있습니까?
참고 : 간단하게하기 위해 여기서는 두 가지 방법 와 언급하고 있지만 ~ 1000 개의 학습 방법의 점수 분포 (예 : 그리드 검색)를 비교하는 데 사용할 수있는 방법에 관심이 있습니다. 사용할 모델에 대한 최종 결정.