답변:
모델의 성능을 테스트하는 경우 (즉, 매개 변수를 최적화하지 않는 경우) 일반적으로 혼동 행렬을 합산합니다. 이렇게 생각하면 데이터를 10 가지 다른 폴드 또는 '테스트'세트로 분할 한 것입니다. 9/10 접기에서 모델을 훈련시키고 첫 번째 접기를 테스트하고 혼동 행렬을 얻습니다. 이 혼동 행렬은 데이터의 1/10 분류를 나타냅니다. 다음 '테스트'세트로 분석을 다시 반복하고 데이터의 1/10을 나타내는 다른 혼동 행렬을 얻습니다. 이 새로운 혼동 행렬을 첫 번째에 추가하면 이제 데이터의 20 %를 나타냅니다. 모든 접기를 실행할 때까지 계속하고 모든 혼란 매트릭스를 합산하고 최종 혼란 매트릭스는 모든 데이터에 대한 해당 모델의 성능 을 나타냅니다. 혼동 행렬의 평균을 구할 수는 있지만 실제로 누적 행렬의 추가 정보를 제공하지는 않으며 접기가 모두 같은 크기가 아닌 경우 편향 될 수 있습니다.
참고 -이것은 반복되지 않은 데이터 샘플링을 가정합니다. 이것이 반복 샘플링에서 다른지 확실하지 않습니다. 내가 무언가를 배우거나 누군가가 방법을 권장하면 업데이트됩니다.