6
수치 최적화에 3 차 도함수를 사용하지 않는 이유는 무엇입니까?
만약 Hessians가 최적화에 너무 좋다면 (예를 들어 Newton의 방법 참조 ) 왜 거기서 멈추는가? 3 차, 4 차, 5 차 및 6 차 도함수를 사용하자 왜 안돼?
그라디언트 디센트는 1 차 반복 최적화 알고리즘입니다. 그래디언트 디센트를 사용하여 함수의 로컬 최소값을 찾으려면 현재 점에서 함수의 그래디언트 (또는 대략적인 그래디언트)의 음수에 비례하여 단계를 수행합니다. 확률 적 경사 하강의 경우 [sgd] 태그도 있습니다.