Zastosowania MCTS / UCT


10

MCTS / UCT to metoda wyszukiwania drzewa gry, która wykorzystuje algorytm bandyty do wybierania obiecujących węzłów do eksploracji. Gry są rozgrywane losowo, a węzły prowadzące do większej liczby zwycięstw są eksplorowane bardziej intensywnie. Algorytm bandytów utrzymuje równowagę między eksploracją węzłów o wysokich wskaźnikach wygranych a eksploracją nieznanych węzłów (i w czystej postaci niekoniecznie korzysta z funkcji oceny heurystycznej). Programy oparte na tej ogólnej technice osiągnęły niesamowite wyniki w komputerze Go .

Czy wyszukiwania Monte-Carlo prowadzone przez bandytów zostały zastosowane do innych problemów z wyszukiwaniem? Na przykład, czy byłoby to użyteczne podejście do przybliżania rozwiązań MAX-SAT, BKP lub innych problemów optymalizacji kombinatorycznej? Czy są jakieś szczególne cechy problemu (strukturalne / statystyczne / itp.), Które sugerowałyby, czy podejście w stylu bandyty byłoby skuteczne?

Czy są jakieś znane problemy deterministyczne, które byłyby całkowicie odporne na metody bandyty, ze względu na charakter przestrzeni rozwiązań?

Odpowiedzi:


7

To nie jest pełna odpowiedź, ale kilka podstawowych spostrzeżeń na temat zastosowania tego do MAX-SAT.

7/8x=0x=1x=0x=17/87/8

7/8NP7/8heurystyka, której używasz, nawet jeśli zgadniesz doskonale, wciąż istnieją niezadowalające formuły, dla których cofanie się do skutku tylko stwierdzi, że są niezadowalające po wykładniczo wielu krokach. Dolne granice długości próbnych rozdzielczości dają te wyniki. Jedno odniesienie to:

Pavel Pudlák, Russell Impagliazzo: Dolna granica dla algorytmów DLL dla k-SAT (wersja wstępna). SODA 2000: 128–136



2

W tym ostatnim artykule ankietowym wymieniono zastosowanie MCTS do szeregu problemów związanych z wyszukiwaniem i optymalizacją innych niż gry, w rozdziale 7.8:

http://pubs.doc.ic.ac.uk/survey-mcts-methods/survey-mcts-methods.pdf

http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=6145622

Jeśli chodzi o domeny, które są całkowicie odporne na metody oparte na bandytach, nie jestem świadomy żadnego podstępu. Szachy są jednym rażącym pominięciem w literaturze MCTS, być może z powodu „stanów pułapek”, które szkodzą wyszukiwaniu, ale także z powodu faktu, że komputerowi gracze w szachy są tak wysoce zoptymalizowani i dobrzy w dzisiejszych czasach, że jakiekolwiek nowe podejście jest mało prawdopodobne wgniecenie na nich.

Pozdrawiam, Cameron

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.