Pytania otagowane jako combinatorial-games

4
Jak radzić sobie z nieprawidłowymi ruchami w uczeniu się zbrojenia?
Chcę stworzyć sztuczną inteligencję, która może grać w pięć w jednym rzędzie / gomoku. Jak wspomniałem w tytule, chcę do tego wykorzystać naukę wzmacniającą. Używam metody gradientu zasad , a mianowicie REINFORCE, z linią bazową. Do przybliżenia wartości i funkcji polityki używam sieci neuronowej . Ma splotowe i w pełni …


1
Kilka wątpliwości dotyczących zastosowania nauki wzmacniającej w grach takich jak szachy
Wynalazłem szachową grę planszową. Zbudowałem silnik, aby mógł grać autonomicznie. Silnik jest w zasadzie drzewem decyzyjnym. Składa się z: Funkcja wyszukiwania, która w każdym węźle znajduje wszystkie możliwe legalne ruchy Funkcja oceny, która przypisuje wartość liczbową do pozycji na planszy (dodatnia oznacza, że ​​pierwsi gracze zdobywają przewagę, ujemna oznacza, że …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.