출력 변수가 서수 인 것을 예측하도록 신경망을 설정했습니다. 가능한 세 가지 출력 A <B <C를 사용하여 아래에 설명합니다.
신경망을 사용하여 범주 형 데이터를 출력하는 방법은 매우 분명합니다. 출력은 마지막 (보통 완전히 연결된) 레이어의 소프트 맥스이며 범주 당 하나씩이며 예측 된 범주는 가장 큰 출력값을 가진 레이어입니다 (이는 많은 인기있는 모델의 기본값). 서수 값에 대해 동일한 설정을 사용하고 있습니다. 그러나이 경우 출력이 의미가없는 경우가 많습니다. 예를 들어 A 및 C의 네트워크 출력은 높지만 B는 낮습니다. 서수 값에는 적합하지 않습니다.
이것에 대한 하나의 아이디어가 있는데, 이는 출력을 A의 경우 1 0, B의 경우 1 0 및 C의 경우 1 1과 비교하여 손실을 계산하는 것입니다. 정확한 임계 값은 나중에 다른 분류기를 사용하여 조정할 수 있습니다 (예 : 베이지안) ) 그러나 이것은 특정 간격 스케일을 처방하지 않고 입력 순서의 필수 아이디어를 포착하는 것으로 보입니다.
이 문제를 해결하는 표준 방법은 무엇입니까? 다양한 접근 방식의 장단점을 설명하는 연구 나 참고 자료가 있습니까?