Książki o uczeniu się przez zbrojenie


10

Od jakiegoś czasu staram się zrozumieć uczenie się o wzmocnieniu, ale jakoś nie jestem w stanie wyobrazić sobie, jak napisać program do nauki o wzmocnieniu, aby rozwiązać problem związany ze światem sieci. Czy możesz zasugerować mi kilka podręczników, które pomogłyby mi zbudować jasną koncepcję uczenia się przez wzmocnienie?



Proszę odnieść się do openai również jego dobre miejsce do nauki Wzmocnienie Nauka od pythona w zasadzie
Vineet Kothari

Odpowiedzi:


7

Oto kilka dobrych referencji na temat nauki zbrojenia:

Klasyczny

Sutton RS, Barto AG. Uczenie się przez zbrojenie: wprowadzenie. Cambridge, Mass: A Bradford Book; 1998. 322 s.

Szkic drugiej edycji jest dostępny za darmo: http://incompleteideas.net/book/the-book-2nd.html

Russell / Norvig Rozdział 21:

Russell SJ, Norvig P, Davis E. Sztuczna inteligencja: nowoczesne podejście. Upper Saddle River, NJ: Prentice Hall; 2010 r.

Bardziej techniczny

Szepesvári C. Algorytmy uczenia wzmacniającego. Wykłady syntetyczne na temat sztucznej inteligencji i uczenia maszynowego. 2010; 4 (1): 1–103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Programowanie dynamiczne i optymalna kontrola. 4. edycja Belmont, Mass .: Athena Scientific; 2007. 1270 s. Rozdział 6, tom 2 jest dostępny za darmo: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Aby uzyskać najnowsze zmiany

Wiering M., van Otterlo M., redaktorzy. Nauka wzmocnienia. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Dostępne od: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G., How JP, Reynolds HJD, Thornton JR, i in. Podejmowanie decyzji w warunkach niepewności: teoria i zastosowanie. 1 edycja. Cambridge, Massachusetts: The MIT Press; 2015. 352 p.

Uczenie się przez wiele agentów

Buşoniu L, Babuška R, Schutter BD. Nauka wzmocnienia przez wielu agentów: przegląd. W: Srinivasan D, Jain LC, redaktorzy. Innowacje w systemach i aplikacjach wieloagentowych - 1. Springer Berlin Heidelberg; 2010 s. 183–221. Dostępne na: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Uczenie maszynowe z wieloma agentami: podejście wzmacniające. Hoboken, New Jersey: Wiley; 2014.

Wideo / Kursy

Proponuję również kurs Davida Silvera w YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa



4

Naprawdę podobała mi się Reinforcement Leraning: Wprowadzenie Richarda Suttona. Zapewnia bardzo ładny widok ujednolicający RL, chociaż nie wspomina o najnowszych podejściach (pochodzi z 1998 r.).


tak naprawdę chciałem zobaczyć problem ze światem siatki, który byłby rozwiązywany przez obliczenia na papierze i długopisie, ponieważ pomogłoby mi to zrozumieć pojęcie, chyba że rozumiem pojęcie, którego nie mogę kodować (szczególnie cenię iterację)
dziewczyna101

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.