Pytania otagowane jako deterministic-policy

3
Czy optymalna polityka jest zawsze stochastyczna, jeśli środowisko jest również stochastyczne?
Czy optymalna polityka jest zawsze stochastyczna (tj. Mapa stanów do rozkładu prawdopodobieństwa na działania), jeśli środowisko jest również stochastyczne? Intuicyjnie, jeśli środowisko jest deterministyczne (to znaczy, jeśli agent jest w staniesssi podejmuje działanie , wtedy następny stan jest zawsze taki sam, bez względu na krok czasowy, wtedy optymalna polityka powinna …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.