2 클래스 레이블이 지정된 데이터에 대해 여러 분류기를 사용하여 분류를 수행했으며 5 배 교차 검증을 사용했습니다. 각 접기에 대해 tp, tn, fp 및 fn을 계산했습니다. 그런 다음 각 테스트의 정확도, 정밀도, 리콜 및 F 점수를 계산했습니다. 내 질문은 결과를 평균화하려고 할 때 정확도의 평균을 취했지만 정확도, 리콜 및 F 점수도 평균화 할 수 있습니까? 아니면 수학적으로 잘못된 것입니까? PS 각 폴드에 사용 된 데이터 세트는 클래스 당 인스턴스 수 측면에서 균형이 잘 맞습니다.
감사.
3
교차 검증을 사용하여 F- 측정 (고조파 평균 정밀도 및 리콜)을 계산하는 것과 동일한 문제가 발생했습니다. 에서 이 문서 가 실제로 완전한 세트의 F-계수를 계산하고, 평균화하지 시연 덜 바이어스 방법이다. 이것이 도움이되기를 바랍니다
—
papafe
@markusian 답변으로 추가하십시오! 이 페이지에서 가장 중요한 것입니다 !!
—
drevicko