Chcę zacząć od scenariusza, który zmusił mnie do zastanowienia się nad tym, jak dobrze może działać MCTS: Załóżmy, że istnieje ruch, który nie został jeszcze dodany do drzewa wyszukiwania. Niektóre warstwy / ruchy są zbyt głębokie. Ale jeśli zagramy w ten ruch, gra jest po prostu wygrana. Załóżmy jednak, że wszystkie ruchy, które można wykonać zamiast tego w danym stanie gry, są bardzo złe. Dla argumentu powiedzmy, że jest 1000 możliwych ruchów i tylko jeden z nich jest dobry (ale bardzo dobry), a reszta jest bardzo zła. Czy MCTS nie rozpoznałby tego i nierośnie drzewo wyszukiwania w kierunku tego ruchu, a także bardzo źle oceniasz to drzewo? Wiem, że MCTS ostatecznie zbiega się do minimax (i ostatecznie zbuduje całe drzewo, jeśli będzie wystarczającej ilości pamięci). Następnie powinien wiedzieć, że ruch jest dobry, mimo że istnieje wiele złych możliwości. Ale wydaje mi się, że w praktyce nie można na tym polegać. Może ktoś może mi powiedzieć, czy jest to poprawna ocena z mojej strony.
Oprócz tego specjalnego scenariusza chciałbym również wiedzieć, czy istnieją inne takie scenariusze, w których MCTS będzie działał źle (lub wyjątkowo dobrze).