볼록한 비용 함수를 고려할 때 BFGS의 도출은보다 직관적입니다.
그러나 일부
배경 정보가 필요합니다. 볼록 기능
을 최소화하려고합니다 .
근사값 x k 가 있다고 가정하십시오 . 그리고, 하나의 최소 근사 F 버림 테일러 전개의 최소 의해
F ( X K + P ) ≈ F ( X (K) ) + ∇ F ( X (K) ) T P +를
에프( x ) → 분x ∈ R엔.
엑스케이에프
즉, 하나 개 보인다
P 되도록
( * ) 최소화 및 집합
X K + 1 : = X K + P .
( * ) - "
p 와 관련하여"의 기울기를 계산하고이를 0으로 설정하면 관계
H ( x k ) [ x k + 1 - x k ] = ∇ f ( x k + 1 ) -에프( x케이+ p ) ≈ f( x케이) + ∇ f( x케이)티p + 12피티H( x케이) p .( ※ )
피( ※ )엑스k + 1: = x케이+ p( ※ )피
여기서,
H는 또는 헤 시안 행렬 '그라디언트 코비안'이다.
H( x케이) [ xk + 1− x케이] = ∇ f( xk + 1) − ∇ f( x케이) ,
H
Hessian의 계산과 반전이 비싸기 때문에 ...
... 짧은 대답
(Broyden의 업데이트 참조) BFGS 업데이트
은 스마트하게 선택된 가중치 Frobenius 규범에 따라 " H - 1 k - H - 1 " W 를 최소화
합니다.H− 1k + 1
∥ H− 1케이− H− 1∥여
- H[ xk + 1− x케이] = ∇ f( xk + 1) − ∇ f( x케이)
- H티= H
여∥ H∥여: = ∥ W1 / 2H여1 / 2∥에프
G : = ∫10H( x케이+ τp ) dτα케이= 1
주요 포인트는 다음과 같습니다.
- 이차 근사에 대한 솔루션으로 실제 비용에 대한 솔루션을 근사하려고합니다.
- 헤 시안의 계산 및 그 역은 비싸다. 간단한 업데이트를 선호합니다.
- 업데이트는 실제 Hessian이 아닌 역수에 대해 최적으로 선택 됩니다.
- 그것이 순위 2 업데이트라는 것은 Frobenius 규범에서 가중치의 특정 선택의 결과입니다.
피