강화 학습에 관한 책


10

나는 강화 학습을 꽤 오랫동안 이해하려고 노력했지만 어떻게 든 그리드 세계 문제를 해결하기 위해 강화 학습을위한 프로그램을 작성하는 방법을 시각화 할 수 없습니다. 강화 학습에 대한 명확한 개념을 세우는 데 도움이 될 교과서를 제안 해 주시겠습니까?



기본적으로 파이썬에서 강화 학습을 배우기에 좋은 곳인 openai를 참조하십시오
Vineet Kothari

답변:


7

다음은 강화 학습에 대한 좋은 참고 자료입니다.

권위 있는

Sutton RS, Barto AG. 강화 학습 : 소개. 매사추세츠 케임브리지 : 브래드 포드 북; 1998. 322 p.

두 번째 버전의 초안은 무료로 제공됩니다. http://incompleteideas.net/book/the-book-2nd.html

러셀 / 노비 그 21 화

Russell SJ, Norvig P, Davis E. 인공 지능 : 현대적인 접근 방식. 뉴저지 북부 새들 리버 : Prentice Hall; 2010.

더 기술적 인

강화 학습을위한 Szepesvári C. 알고리즘 인공 지능과 머신 러닝에 관한 종합 강의. 2010; 4 (1) : 1–103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. 동적 프로그래밍 및 최적 제어. 제 4 판. 매사추세츠 주 벨몬트 : Athena Scientific; 2007. 1270 p. 6 장, vol 2는 무료로 제공됩니다 : http://web.mit.edu/dimitrib/www/dpchapter.pdf

보다 최근의 개발

Wiering M, van Otterlo M, 편집자. 강화 학습. 베를린, 하이델베르크 : Springer Berlin Heidelberg; 2012 이용 가능 : http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR 등. 불확실한 의사 결정 : 이론과 적용. 1 판. 케임브리지, 매사추세츠 : MIT Press; 2015. 352 p.

멀티 에이전트 강화 학습

Buşoniu L, Babuška R, Schutter BD. 다중 에이전트 강화 학습 : 개요. 에서 : Srinivasan D, Jain LC, 편집자. 다중 에이전트 시스템 및 애플리케이션의 혁신-1. 스프링거 베를린 하이델베르크; 2010 p. 183–221. http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7 에서 사용 가능

슈워츠 HM. 멀티 에이전트 머신 러닝 : 강화 접근법. 뉴저지 호보 켄 : 와일리; 2014.

비디오 / 코스

YouTube의 David Silver 코스도 제안하겠습니다. https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa



4

Reinforcement Leraning : Richard Sutton 의 소개 를 정말 좋아했습니다 . 최신 접근 방식을 언급하지는 않지만 RL에 대한 매우 통일 된 견해를 제공합니다 (1998 년부터).


사실은 내가 그 날이 개념을 이해하는 데 도움이 때문에 내가 개념을 이해하지 않는 한, 그리드 세계 문제는 펜과 종이에 계산에 의해 해결되고보고 싶어 내가 할 수없는 코드 (특별히 값 반복)
girl101

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.