교차 엔트로피 손실 함수의 다른 정의


12

신경망과 딥 러닝 닷컴 자습서를 통해 신경망에 대해 배우기 시작했습니다. 특히 3 장 에는 교차 엔트로피 기능에 대한 섹션이 있으며 교차 엔트로피 손실을 다음과 같이 정의합니다.

=1엑스제이(와이제이ln제이+(1와이제이)ln(1제이))

그러나 Tensorflow 소개를 읽고 교차 엔트로피 손실은 다음과 같이 정의됩니다.

=1엑스제이(와이제이ln제이) (위와 동일한 기호를 사용하는 경우)

그런 다음 무슨 일이 일어나고 있는지 찾기 위해 주위를 탐색하면서 다른 엔트로피 손실의 완전히 다른 정의를 사용하는 다른 메모 세트 ( https://cs231n.github.io/linear-classify/#softmax-classifier )를 찾았습니다. 신경망보다는 소프트 맥스 분류기 시간.

누군가 여기서 무슨 일이 일어나고 있는지 설명해 줄 수 있습니까? 왜 불일치가 있습니까? 사람들이 교차 엔트로피 손실을 무엇이라고 정의합니까? 중요한 원칙이 있습니까?


답변:


18

이 세 가지 정의는 본질적으로 동일합니다.

1) Tensorflow 도입 ,

=1엑스제이(와이제이ln제이).

제이=2

=1엑스(와이1ln1+와이2ln2)
제이제이=1제이와이제이=1
=1엑스(와이1ln1+(1와이1)ln(11))

와이와이케이

엑스=제이(와이제이ln제이)=(0+0+...+와이케이ln케이)=ln케이.

엑스=ln(케이)=ln(이자형에프케이제이이자형에프제이).

0

에서 삼장 , 식 (63)는 여러 sigmoids인가 교차 엔트로피 (즉 1 합산되지 있음)의 상태이다 인트로 Tensoflow 크로스 엔트로피 softmax를 출력 상에 계산된다.

dontloo에 의해 설명 된 것처럼 두 수식은 본질적으로 두 클래스에 해당하지만 두 개 이상의 클래스가 고려되는 것은 아닙니다. Softmax는 독점 클래스가있는 멀티 클래스에 적합합니다 ( , 샘플 당 하나의 레이블 만 있으면 레이블의 원-핫 인코딩이 가능합니다). 여러 수업).

이 다른 dontloo 답변 도 참조하십시오 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.