Książki o uczeniu się przez zbrojenie

10

Od jakiegoś czasu staram się zrozumieć uczenie się o wzmocnieniu, ale jakoś nie jestem w stanie wyobrazić sobie, jak napisać program do nauki o wzmocnieniu, aby rozwiązać problem związany ze światem sieci. Czy możesz zasugerować mi kilka podręczników, które pomogłyby mi zbudować jasną koncepcję uczenia się przez wzmocnienie?

machine-learning books reinforcement-learning

— dziewczyna 101
źródło

stats.stackexchange.com/questions/130130/…

— Anton Tarasenko,

Proszę odnieść się do openai również jego dobre miejsce do nauki Wzmocnienie Nauka od pythona w zasadzie

— Vineet Kothari

7

Oto kilka dobrych referencji na temat nauki zbrojenia:

Klasyczny

Sutton RS, Barto AG. Uczenie się przez zbrojenie: wprowadzenie. Cambridge, Mass: A Bradford Book; 1998. 322 s.

Szkic drugiej edycji jest dostępny za darmo: http://incompleteideas.net/book/the-book-2nd.html

Russell / Norvig Rozdział 21:

Russell SJ, Norvig P, Davis E. Sztuczna inteligencja: nowoczesne podejście. Upper Saddle River, NJ: Prentice Hall; 2010 r.

Bardziej techniczny

Szepesvári C. Algorytmy uczenia wzmacniającego. Wykłady syntetyczne na temat sztucznej inteligencji i uczenia maszynowego. 2010; 4 (1): 1–103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Programowanie dynamiczne i optymalna kontrola. 4. edycja Belmont, Mass .: Athena Scientific; 2007. 1270 s. Rozdział 6, tom 2 jest dostępny za darmo: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Aby uzyskać najnowsze zmiany

Wiering M., van Otterlo M., redaktorzy. Nauka wzmocnienia. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Dostępne od: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G., How JP, Reynolds HJD, Thornton JR, i in. Podejmowanie decyzji w warunkach niepewności: teoria i zastosowanie. 1 edycja. Cambridge, Massachusetts: The MIT Press; 2015. 352 p.

Uczenie się przez wiele agentów

Buşoniu L, Babuška R, Schutter BD. Nauka wzmocnienia przez wielu agentów: przegląd. W: Srinivasan D, Jain LC, redaktorzy. Innowacje w systemach i aplikacjach wieloagentowych - 1. Springer Berlin Heidelberg; 2010 s. 183–221. Dostępne na: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Uczenie maszynowe z wieloma agentami: podejście wzmacniające. Hoboken, New Jersey: Wiley; 2014.

Wideo / Kursy

Proponuję również kurs Davida Silvera w YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa

— Juan Leni
źródło

7

Istnieje bezpłatny kurs online na temat nauki zbrojenia przez Udacity. Sprawdź: uczenie maszynowe: uczenie się zbrojenia

— Sreejithc321
źródło

Warto wspomnieć, że problem światowego gridu jest prezentowany jako część tego kursu.

— Neil Slater,

tak, widziałem to, ale niewystarczająco, aby zakodować to samo

— girl101

4

Naprawdę podobała mi się Reinforcement Leraning: Wprowadzenie Richarda Suttona. Zapewnia bardzo ładny widok ujednolicający RL, chociaż nie wspomina o najnowszych podejściach (pochodzi z 1998 r.).

— Martin Modrák
źródło

tak naprawdę chciałem zobaczyć problem ze światem siatki, który byłby rozwiązywany przez obliczenia na papierze i długopisie, ponieważ pomogłoby mi to zrozumieć pojęcie, chyba że rozumiem pojęcie, którego nie mogę kodować (szczególnie cenię iterację)

— dziewczyna101

1

Możesz zapoznać się z moją książką - Hands-On Reinforcement Learning with Python, która wyjaśnia uczenie się od podstaw od zaawansowanego algorytmu uczenia się głębokiego wzmocnienia.

Cały kod wraz z objaśnieniem jest już dostępny w moim repozytorium github. https://github.com/sudharsan13296/Hands-On-Reinforcement-Learning-With-Python

— Sudharsan
źródło