데이터가 있고이 데이터로 모델 (선형 회귀 모델)을 만들고 싶습니다. 다음 단계에서는 모델에 LOOCV (Leave-One-Out Cross-Validation)를 적용하여 성능이 어느 정도인지 확인하고 싶습니다.
LOOCV를 올바르게 이해했다면이 샘플 (훈련 세트)을 제외한 모든 샘플을 사용하여 각 샘플 (테스트 세트)에 대해 새 모델을 작성합니다. 그런 다음 모델을 사용하여 테스트 세트를 예측하고 오류 합니다.
다음 단계에서는 선택한 함수를 사용하여 생성 된 모든 오류 (예 : 평균 제곱 오류)를 집계합니다. 이 값을 사용하여 모델의 품질 (또는 적합도)을 판단 할 수 있습니다.
질문 : 이 품질-값이 적용되는 모델이 어떤 모델이므로 LOOCV에서 생성 된 지표가 내 사례에 적합한 경우 어떤 모델을 선택해야합니까? LOOCV는 다른 모델을 보았습니다 (여기서 은 샘플 크기 임). 어떤 모델을 선택해야합니까?
- 모든 샘플을 사용하는 모델입니까? 이 모델은 LOOCV 프로세스 중에 계산되지 않았습니다!
- 오류가 가장 적은 모델입니까?