강화 학습에 관한 교과서


12

강화 학습에서 교과서 / 강의 노트를 찾고 있습니다. 나는 "통계 학습 입문"을 좋아 하지만 불행히도이 주제를 다루지 않습니다. 나는 Sutton과 Barto의 저서가 표준 참고 자료이며 아마도 NDP 도 좋지만 1997-98 년 날짜였으며이 분야가 최근에 꽤 발전 할 가능성이 있기 때문에 더 현대적인 설명을 찾고자했습니다. 시각.

답변:


15

Sutton과 Barto가 여전히 표준이라고 생각합니다. 온라인 AI 클래스의 슬라이드 데크와 메모가 많이 있지만 일반적으로 너무 자세하게 설명하지는 않습니다.

서튼과 바르 토는 약간 나이가 들었지만 교과서 2 판을 준비하고 있습니다. 2018 년 1 월 초안이 여기에 있습니다 . 그것은 Sutton의 웹 페이지 에서 링크되어 있으며 , 첫 번째 판의 전문을 가지고 있습니다.

TD(λ)

그외에, 당신은 몇몇 논문으로 다이빙을 시도 할 수 있습니다-강화 학습 자료는 꽤 접근하기 쉬운 경향이 있습니다.


고마워, 나는 새 판을 보았지만 그것이 많이 업데이트되었다고 말하지는 않을 것이다. 여전히 최신 노출에 관심이 있습니다.
율리시스

예, 그것은 완전히 완전한 점검은 아니지만, 본질적으로 단지 논문 모음 인 Springer의 "강의 노트"외에는 아무것도 염두에 두지 않습니다. 다른 것을 찾으면 업데이트를 게시하십시오. 확인하고 싶습니다.
Matt Krause

나는 확실히 내가 할 것, 볼
율리시즈

1
@CharlieParker, 확실하지 않습니다. 가장 최근의 초안 (2017 년 6 월 19 일)은 상당히 완성 된 것으로 보이며 MIT Press를 언급하지만 MIT Press 사이트는 여전히 첫 번째 판을 판매하는 것으로 보입니다. 가치있는 것은 초안이 작성자의 공개 웹 사이트에서 직접 제공되므로 "누설 된"버전 또는 이와 유사한 것을 사용하는 것에 대해 걱정할 필요가 없습니다.
매트 크라우스

1
@Thomas, 링크를 최신 초안으로 업데이트했습니다.
매트 크라우스

6

2010 년에 출판 된 Csaba Szepesvári의 강화 학습 알고리즘 을 확인하십시오 . PDF는 웹 사이트에서 다운로드 할 수 있습니다. 제 생각에는 Sutton 및 Barto보다 약간 기술적이지만 재료는 적습니다.


6

여기 좋은 교과서 / 참고 자료가 있습니다.

권위 있는

Sutton RS, Barto AG. 강화 학습 : 소개. 매사추세츠 케임브리지 : 브래드 포드 북; 1998. 322 p.

두 번째 버전의 초안은 무료로 제공됩니다 : https://webdocs.cs.ualberta.ca/~sutton/book/the-book.html

러셀 / 노비 그 21 화

Russell SJ, Norvig P, Davis E. 인공 지능 : 현대적인 접근 방식. 뉴저지 북부 새들 리버 : Prentice Hall; 2010.

더 기술적 인

강화 학습을위한 Szepesvári C. 알고리즘 인공 지능과 머신 러닝에 관한 종합 강의. 2010; 4 (1) : 1–103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. 동적 프로그래밍 및 최적 제어. 제 4 판. 매사추세츠 주 벨몬트 : Athena Scientific; 2007. 1270 p. 6 장, vol 2는 무료로 제공됩니다 : http://web.mit.edu/dimitrib/www/dpchapter.pdf

보다 최근의 개발

Wiering M, van Otterlo M, 편집자. 강화 학습. 베를린, 하이델베르크 : Springer Berlin Heidelberg; 2012 이용 가능 : http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, JP, Reynolds HJD, Thornton JR 등. 불확실한 의사 결정 : 이론과 적용. 1 판. 케임브리지, 매사추세츠 : MIT Press; 2015. 352 p.

멀티 에이전트 강화 학습

Buşoniu L, Babuška R, Schutter BD. 다중 에이전트 강화 학습 : 개요. 에서 : Srinivasan D, Jain LC, 편집자. 다중 에이전트 시스템 및 애플리케이션의 혁신-1. 스프링거 베를린 하이델베르크; 2010 p. 183–221. http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7 에서 사용 가능

슈워츠 HM. 멀티 에이전트 머신 러닝 : 강화 접근법. 뉴저지 호보 켄 : 와일리; 2014.

비디오 / 코스

YouTube의 David Silver 코스도 제안하겠습니다. https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.