Pytania otagowane jako reinforcement-learning

7
Jak wytrenować sztuczną sieć neuronową do gry w Diablo 2 za pomocą wizualnych danych wejściowych?
Obecnie próbuję zmusić ANN do grania w grę wideo i liczyłem na pomoc od wspaniałej społeczności tutaj. Zdecydowałem się na Diablo 2. Gra toczy się więc w czasie rzeczywistym iz izometrycznego punktu widzenia, a gracz kontroluje jednego awatara, na którym skupiona jest kamera. Aby było konkretnie, zadaniem twojej postaci jest …

4
Jaka jest różnica między iteracją wartości a iteracją polityki?
Jaka jest różnica między iteracją polityki a iteracją wartości w uczeniu się przez wzmacnianie ? O ile rozumiem, w iteracji wartości używasz równania Bellmana do rozwiązania optymalnej polityki, podczas gdy w iteracji polityki wybierasz losowo politykę π i znajdujesz nagrodę za tę politykę. Wątpię, że jeśli wybierasz losową polisę π …


1
Błąd typu: len nie jest dobrze zdefiniowany dla symbolicznych Tensorów. (aktywacja_3 / Tożsamość: 0) Zadzwoń do „x.shape” zamiast do „len (x)” w celu uzyskania informacji o kształcie
Próbuję wdrożyć model DQL w jednej grze na siłowni openAI. Ale daje mi następujący błąd. Błąd typu: len nie jest dobrze zdefiniowany dla symbolicznych Tensorów. (aktywacja_3 / Tożsamość: 0) Zadzwoń x.shapezamiast len(x) informacji o kształcie. Tworzenie środowiska na siłowni: ENV_NAME = 'CartPole-v0' env = gym.make(ENV_NAME) np.random.seed(123) env.seed(123) nb_actions = env.action_space.n …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.