TLDR :
내 데이터 세트는 매우 작은 (120) 샘플입니다. 10 배 교차 검증을 수행하는 동안 다음을 수행해야합니다.
각 테스트 폴드에서 출력을 수집하여 벡터로 연결 한 다음이 전체 예측 벡터 (120 개 샘플)에 대한 오류를 계산합니까?
또는 대신 각 겹 에서 얻은 출력 (폴드 당 12 샘플)의 오류를 계산 한 다음 최종 오류 추정치를 10 배 오류 추정치의 평균으로 가져와야합니까?
이 기술들 사이의 차이점을 주장하는 과학 논문이 있습니까?
배경 : 다중 레이블 분류에서 매크로 / 마이크로 점수와의 잠재적 관계 :
이 질문은 다중 레이블 분류 작업 (예 : 5 레이블)에서 자주 사용되는 마이크로 평균 과 매크로 평균 의 차이와 관련이있을 수 있습니다 .
다중 레이블 설정 에서 120 개의 샘플에 대한 5 개의 분류기 예측 모두에 대해 진 양성, 위양성, 진 음성, 위음성 의 집계 된 우발성 표를 만들어 미세 평균 점수 를 계산 합니다. 이 우발 상황표는 마이크로 정밀도, 마이크로 리콜 및 마이크로 f 측정을 계산하는 데 사용됩니다. 따라서 120 개의 샘플과 5 개의 분류 기가 있으면 마이크로 측정 값은 600 개의 예측 (120 개의 샘플 * 5 개의 레이블)에서 계산됩니다.
매크로 변형을 사용하는 경우 각 레이블에서 독립적 으로 측정 값 (정밀도, 리콜 등)을 계산 하고 마지막으로 이러한 측정 값의 평균을 구합니다.
마이크로 대 매크로 추정치 의 차이 뒤에있는 아이디어 는 이진 분류 문제에서 K- 폴드 설정에서 수행 할 수있는 것으로 확장 될 수 있습니다. 10 배의 경우 10 개 이상의 평균 ( 매크로 측정) 또는 10 개의 실험을 연결하고 마이크로 측정을 계산할 수 있습니다.
배경-확장 된 예 :
다음 예제는 질문을 보여줍니다. 12 개의 테스트 샘플이 있고 10 개의 폴드가 있다고 가정 해 봅시다.
- 접기 1 : TP = 4, FP = 0, TN = 8 정밀도 = 1.0
- 폴드 2 : TP = 4, FP = 0, TN = 8 정밀도 = 1.0
- 접기 3 : TP = 4, FP = 0, TN = 8 정밀도 = 1.0
- 폴드 4 : TP = 0, FP = 12, 정밀도 = 0
- 폴드 5 .. 폴드 10 : 모두 동일한 TP = 0, FP = 12 및 정밀도 = 0
나는 다음 표기법을 사용했다.
TP = # True Positives, FP = # False Positive, TN = # True 부정
결과는 다음과 같습니다.
- 10 배의 평균 정밀도 = 3/10 = 0.3
- 10 배 예측 예측 연결에 대한 정밀도 = TP / TP + FP = 12 / 12 + 84 = 0.125
값 0.3과 0.125는 매우 다릅니다 !