1
강화 학습에 대한 할인 요소의 의미
Atari의 게임 에서 Google 심층 업적을 읽은 후 q-learning 및 q-networks를 이해하려고 노력하고 있지만 약간 혼란 스럽습니다. 할인 요소의 개념에서 혼란이 발생합니다. 내가 이해 한 것에 대한 간략한 요약. 심층 컨볼 루션 신경망 (convolutional neural network)은 행동의 최적 기대 값의 값을 추정하는데 사용된다. 네트워크는 손실 함수를 최소화하는 여기서, E S …