«gradient-descent» 태그된 질문

2
평균 제곱 오차는 신경망의 맥락에서 항상 볼록합니까?
MSE가 볼록하기 때문에 훌륭하다고 언급 한 여러 자료. 그러나 나는 특히 신경망의 맥락에서 방법을 얻지 못합니다. 우리가 다음을 가지고 있다고 가정 해 봅시다. XXX: 훈련 데이터 세트 YYY: 목표 ΘΘ\Theta: 모델의 매개 변수 세트 fΘfΘf_\Theta (비선형 성을 갖는 신경망 모델) 그때: MSE(Θ)=(fΘ(X)−Y)2MSE⁡(Θ)=(fΘ(X)−Y)2\operatorname{MSE}(\Theta) = (f_\Theta(X) - Y)^2 이 손실 함수가 항상 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.