«reinforcement-learning» 태그된 질문

1
강화 학습에 대한 할인 요소의 의미
Atari의 게임 에서 Google 심층 업적을 읽은 후 q-learning 및 q-networks를 이해하려고 노력하고 있지만 약간 혼란 스럽습니다. 할인 요소의 개념에서 혼란이 발생합니다. 내가 이해 한 것에 대한 간략한 요약. 심층 컨볼 루션 신경망 (convolutional neural network)은 행동의 최적 기대 값의 값을 추정하는데 사용된다. 네트워크는 손실 함수를 최소화하는 여기서, E S …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.