나는에 관심이 있어요 (깊은) 강화 학습 (RL) . 이 분야에 뛰어 들기 전에 게임 이론 (GT) 과정을 수강해야 합니까?
GT 와 RL 은 어떤 관련이 있습니까?
나는에 관심이 있어요 (깊은) 강화 학습 (RL) . 이 분야에 뛰어 들기 전에 게임 이론 (GT) 과정을 수강해야 합니까?
GT 와 RL 은 어떤 관련이 있습니까?
답변:
강화 학습 (RL)에서 기본 Markov 의사 결정 프로세스 (MDP)를 상상하는 것이 일반적입니다. RL의 목표는 종종 부분적으로 만 지정된 MDP에 대한 좋은 정책을 배우는 것입니다. MDP는 총, 평균 또는 할인 보상과 같은 다양한 목표를 가질 수 있습니다. 여기서 할인 보상은 RL에 대한 가장 일반적인 가정입니다. 2 인 (즉, 게임) 설정에 대한 MDP의 확장 된 연구가있다. 예를 들어
Filar, Jerzy 및 Koos Vrieze. 경쟁력있는 Markov 의사 결정 프로세스 . Springer Science & Business Media, 2012.
MDP가 공유하는 기본 이론과 Banach 고정 점 정리, 가치 반복, Bellman 최적 성, 정책 반복 / 전략 개선 등 2 인 (제로섬) 게임으로의 확장이 있습니다. MDP (및 RL)와 이러한 특정 유형의 게임 간의 밀접한 관계 :
게임 이론은 MARL (Multi-agent Reinforcement learning)과 관련이 있습니다.
확률 론적 게임을 보거나 멀티 에이전트 강화 학습을위한 확률 론적 게임 이론 분석 기사를 읽으십시오 .
GT를 RL의 전제 조건으로 보지 않을 것입니다. 그러나 다중 에이전트 사례에 대한 확장 기능을 제공합니다.