답변:
볼록
기능 함께 볼록한, 임의위한 경우 , 및 대 ,
이러한 볼록 는 하나의 글로벌 최소값을 갖는다 는 것이 입증 될 수있다 . 고유 한 전역 최소값은 오류 함수 최소화와 같이 전역 최소값에 대한 수렴을 시도하는 알고리즘에서 발생할 수있는 로컬 최소값에 의해 생성 된 트랩을 제거합니다.
오류 함수가 모든 연속적인 선형 컨텍스트 및 많은 비선형 컨텍스트에서 100 % 신뢰할 수 있지만 모든 가능한 비선형 컨텍스트에 대한 전역 최소값에 대한 수렴을 의미하지는 않습니다.
평균 제곱 오류
이상적인 시스템 거동을 설명 하는 함수 와 시스템 의 모델 (여기서 는 매개 변수 벡터, 행렬, 큐브 또는 하이퍼 큐브이고 )이며 합리적으로 또는 수렴을 통해 생성됩니다. (신경망 훈련에서와 같이), 평균 제곱 오차 (MSE) 기능은 다음과 같이 나타낼 수 있습니다.
당신이 읽고있는이 물질은 아마도 주장 아니라고 또는 에 대한 볼록 ,하지만 에 대한 볼록 과 그들이 무엇이든간에. 이 이후의 진술은 모든 연속적인 및 대해 입증 될 수 있습니다 .
수렴 알고리즘 혼동
질문이 합리적인 MSE 수렴 마진 내 에서 근사한 특정 및 를 달성하는 방법 이 혼란 스러울 수 있는지 여부는 "예"입니다. 그렇기 때문에 MSE가 유일한 오류 모델이 아닙니다.
요약
가장 좋은 방법은 다음 지식을 바탕으로 를 일련의 스톡 볼록 오류 모델에서 정의하거나 선택해야한다는 것입니다.
스톡 볼록 오차 모델 세트는 단순성과 계산 적산 때문에 MSE 모델을 포함합니다.