예 : 직업 설명에 "영국의 Java Senior Engineer"문장이 있습니다.
나는 2 개 종류로 예측하는 깊은 학습 모델을 사용하려면 : English
와 IT jobs
. 기존 분류 모델을 사용하는 경우 softmax
마지막 레이어에서 함수가있는 레이블 하나만 예측할 수 있습니다 . 따라서 두 모델 신경망을 사용하여 두 범주 모두에서 "예"/ "아니오"를 예측할 수 있지만 더 많은 범주가 있으면 너무 비쌉니다. 그렇다면 동시에 2 개 이상의 카테고리를 예측할 수있는 딥 러닝 또는 머신 러닝 모델이 있습니까?
"편집": 기존의 접근 방식에 따라 3 개의 레이블이 있으면 [1,0,0]으로 인코딩되지만 제 경우에는 [1,1,0] 또는 [1,1,1]로 인코딩됩니다.
예 : 라벨이 3 개 있고 문장이이 모든 라벨에 맞는 경우. 따라서 softmax 함수의 출력이 [0.45, 0.35, 0.2] 인 경우 3 개의 레이블 또는 2 개의 레이블로 분류해야합니까? 우리가 할 때 주요 문제는 다음과 같습니다. 1, 2 또는 3 레이블로 분류하기에 좋은 임계 값은 무엇입니까?