Oto kilka dobrych podręczników / referencji:
Klasyczny
Sutton RS, Barto AG. Uczenie się przez zbrojenie: wprowadzenie. Cambridge, Mass: A Bradford Book; 1998. 322 s.
Projekt drugiej edycji jest dostępny za darmo: https://webdocs.cs.ualberta.ca/~sutton/book/the-book.html
Russell / Norvig Rozdział 21:
Russell SJ, Norvig P, Davis E. Sztuczna inteligencja: nowoczesne podejście. Upper Saddle River, NJ: Prentice Hall; 2010 r.
Bardziej techniczny
Szepesvári C. Algorytmy uczenia wzmacniającego. Wykłady syntetyczne na temat sztucznej inteligencji i uczenia maszynowego. 2010; 4 (1): 1–103. http://www.ualberta.ca/~szepesva/RLBook.html
Bertsekas DP. Programowanie dynamiczne i optymalna kontrola. 4. edycja Belmont, Mass .: Athena Scientific; 2007. 1270 s.
Rozdział 6, tom 2 jest dostępny za darmo: http://web.mit.edu/dimitrib/www/dpchapter.pdf
Aby uzyskać najnowsze zmiany
Wiering M., van Otterlo M., redaktorzy. Nauka wzmocnienia. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Dostępne od: http://link.springer.com/10.1007/978-3-642-27645-3
Kochenderfer MJ, Amato C, Chowdhary G., How JP, Reynolds HJD, Thornton JR, i in. Podejmowanie decyzji w warunkach niepewności: teoria i zastosowanie. 1 edycja. Cambridge, Massachusetts: The MIT Press; 2015. 352 p.
Uczenie się przez wiele agentów
Buşoniu L, Babuška R, Schutter BD. Nauka wzmocnienia przez wielu agentów: przegląd. W: Srinivasan D, Jain LC, redaktorzy. Innowacje w systemach i aplikacjach wieloagentowych - 1. Springer Berlin Heidelberg; 2010 s. 183–221. Dostępne na: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7
Schwartz HM. Uczenie maszynowe z wieloma agentami: podejście wzmacniające. Hoboken, New Jersey: Wiley; 2014.
Wideo / Kursy
Proponuję również kurs Davida Silvera w YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa