문제는 :
교차 엔트로피 손실과 함께 입력-> 숨김-숨겨진 최대-> 출력에 시그 모이 드를 사용하여 단일 숨겨진 레이어 신경망에 대한 입력 레이어에 대한 그라디언트를 도출하십시오.
체인 규칙을 사용하여 대부분의 파생 작업을 수행 할 수 있지만 실제로 함께 "체인"하는 방법에 대해서는 확실하지 않습니다.
몇 가지 표기법 정의
, S 자형 함수입니다
,
, softmax 기능입니다
, 실제 레이블 원핫 벡터입니다
그런 다음 체인 규칙에 따라
개별 그라디언트는 다음과 같습니다.
이제 정의를 서로 연결해야합니다. 단일 변수에서는 이것이 쉽습니다. 모든 것을 곱하면됩니다. 벡터에서는 요소 별 곱셈을 사용할지 행렬 곱셈을 사용할지 잘 모르겠습니다.
여기서 은 요소 별 벡터 곱셈이고 는 행렬 곱셈입니다. 이 작업 조합은 차원 벡터 를 얻기 위해 함께 묶을 수있는 유일한 방법입니다. 이어야합니다.
내 질문은 : 어떤 연산자를 사용 해야하는지 알 수있는 원칙적인 방법은 무엇입니까? 와 사이의 요소 별 요소가 필요하기 때문에 특히 혼란 스럽습니다 .
감사!