나는 이것에 대해 결코 전문가가 아니지만 이것이 도움이 될 것입니다. 다음은 벨만 방정식에 대한 간단한 예입니다.
V(y)=maxxu(x,y)+βV(y′)
s.t.y′=f(x,y)
이것은 알려지지 않은 함수 V의 함수 방정식입니다.이 문제에 대한 해결책은 위의 방정식을 만족시키는 함수 V입니다. 방정식을 보면 솔루션이 벨만 방정식의 RHS에서 연산자의 고정 점이어야 함이 분명합니다. 올바른 V와 임의의 y를 취하고 계산하면
maxxu(x,y)+βV(y′)
s.t.y′=f(x,y)
얻습니다 . Bellman 방정식의 RHS 인 연산자는 함수에서 작동하며 솔루션은 함수의 일부 공간에서 고정 소수점입니다.V(y)
이 고정 점이 존재하는지, 어떻게 찾는 지 다른 질문입니다. 여기에서는 수축 매핑 이론에 호소합니다. u에 대한 일반적인 가정하에 제공 하면 위의 최대화 단계는 V에 대한 추측에 대한 수축 매핑입니다. 이는 고유 한 고정 소수점 V가 존재한다는 것을 의미하며, 연속 반복하여 찾으십시오.β<1