음의 로그 우도 (eq.80)는 다중 클래스 교차 엔트로피 (참조 : 패턴 인식 및 기계 학습 섹션 4.3.4)로도 알려져 있습니다. 사실 동일한 공식에 대한 두 가지 다른 해석이기 때문입니다.
eq.57은 Bernoulli 분포의 음의 로그 가능성이고, eq.80은 관측치가 하나 인 다항식 분포의 음의 로그 가능성입니다 (Beroulli의 다중 클래스 버전).
이진 분류 문제의 경우, softmax 함수 는 각 클래스의 예측을 제공하기 위해 두 값 (0과 1 사이에서 합계 1)을 출력 합니다. sigmoid 함수 는 한 클래스의 예측을 제공하기 위해 하나의 값 (0과 1 사이)을 출력하지만 다른 클래스는 1-p입니다.
따라서 eq.80은 sigmoid 출력에 직접 적용 할 수 없지만 eq.57과 본질적으로 동일한 손실입니다.
이 답변 도 참조하십시오 .
다음은 이진 분류 문제에 대한 (sigmoid + binary cross-entropy)와 (softmax + multiclass cross-entropy) 간의 연결에 대한 간단한 그림입니다.
두 가지 범주의 분리 점으로 를 취한다고합시다 .0.5
σ( w x + b ) = 0.5
w x + b = 0
이것은 피쳐 공간의 결정 경계입니다.
softmax 출력의 경우
이므로 두 배의 매개 변수가 있지만 동일한 모델로 유지됩니다.ew1x+b1=ew2x+b2w1x+b1=w2x+b2(w1-w2)x+(b1−b2)
이자형승1x + b1이자형승1x + b1+ 전자승2x + b2= 0.5
이자형승1x + b1= 전자승2x + b2
승1x + b1= w2x + b2
( 승1− w2) x + ( b1− b2) = 0
다음은이 두 가지 방법을 사용하여 얻은 의사 결정 경계를 보여줍니다.