나는 강화 학습을 꽤 오랫동안 이해하려고 노력했지만 어떻게 든 그리드 세계 문제를 해결하기 위해 강화 학습을위한 프로그램을 작성하는 방법을 시각화 할 수 없습니다. 강화 학습에 대한 명확한 개념을 세우는 데 도움이 될 교과서를 제안 해 주시겠습니까?
나는 강화 학습을 꽤 오랫동안 이해하려고 노력했지만 어떻게 든 그리드 세계 문제를 해결하기 위해 강화 학습을위한 프로그램을 작성하는 방법을 시각화 할 수 없습니다. 강화 학습에 대한 명확한 개념을 세우는 데 도움이 될 교과서를 제안 해 주시겠습니까?
답변:
다음은 강화 학습에 대한 좋은 참고 자료입니다.
권위 있는
Sutton RS, Barto AG. 강화 학습 : 소개. 매사추세츠 케임브리지 : 브래드 포드 북; 1998. 322 p.
두 번째 버전의 초안은 무료로 제공됩니다. http://incompleteideas.net/book/the-book-2nd.html
러셀 / 노비 그 21 화
Russell SJ, Norvig P, Davis E. 인공 지능 : 현대적인 접근 방식. 뉴저지 북부 새들 리버 : Prentice Hall; 2010.
더 기술적 인
강화 학습을위한 Szepesvári C. 알고리즘 인공 지능과 머신 러닝에 관한 종합 강의. 2010; 4 (1) : 1–103. http://www.ualberta.ca/~szepesva/RLBook.html
Bertsekas DP. 동적 프로그래밍 및 최적 제어. 제 4 판. 매사추세츠 주 벨몬트 : Athena Scientific; 2007. 1270 p. 6 장, vol 2는 무료로 제공됩니다 : http://web.mit.edu/dimitrib/www/dpchapter.pdf
보다 최근의 개발
Wiering M, van Otterlo M, 편집자. 강화 학습. 베를린, 하이델베르크 : Springer Berlin Heidelberg; 2012 이용 가능 : http://link.springer.com/10.1007/978-3-642-27645-3
Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR 등. 불확실한 의사 결정 : 이론과 적용. 1 판. 케임브리지, 매사추세츠 : MIT Press; 2015. 352 p.
멀티 에이전트 강화 학습
Buşoniu L, Babuška R, Schutter BD. 다중 에이전트 강화 학습 : 개요. 에서 : Srinivasan D, Jain LC, 편집자. 다중 에이전트 시스템 및 애플리케이션의 혁신-1. 스프링거 베를린 하이델베르크; 2010 p. 183–221. http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7 에서 사용 가능
슈워츠 HM. 멀티 에이전트 머신 러닝 : 강화 접근법. 뉴저지 호보 켄 : 와일리; 2014.
비디오 / 코스
YouTube의 David Silver 코스도 제안하겠습니다. https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa
Udacity의 강화 학습에 대한 무료 온라인 과정이 있습니다. 점검 : 기계 학습 : 강화 학습
Reinforcement Leraning : Richard Sutton 의 소개 를 정말 좋아했습니다 . 최신 접근 방식을 언급하지는 않지만 RL에 대한 매우 통일 된 견해를 제공합니다 (1998 년부터).