답변:
기계 학습에서 분류 문제에 관해서는, 크로스 엔트로피와 KL 발산 이 동일 합니다. 질문에서 이미 언급했듯이 일반적인 공식은 다음과 같습니다.
여기서 a "true"분포이고 는 추정 분포이고, 는 교차 엔트로피이고, 는 엔트로피이고 는 Kullback-Leibler 분기입니다.
머신 러닝에서 는지면 진리 클래스의 일대일 표현입니다.
기본적으로 델타 함수 분포입니다. 그러나 델타 함수의 엔트로피는 0이므로 KL 발산은 단순히 크로스 엔트로피와 같습니다.
실제로, 가 이 아니더라도 (예를 들어, 소프트 라벨), 고정되어 있으며 기울기에 기여하지 않습니다. 최적화 측면에서 간단히 제거하고 Kullback-Leibler 분기를 최적화하는 것이 안전합니다.