Dlaczego eksperci szachowi byli zaskoczeni zwycięstwem AlphaZero przeciwko Sztokfiszowi?


10

Został on niedawno zwrócił moją uwagę , że eksperci Chess wziął wyniku tego teraz słynnym meczu jako coś rozstroju.

Zobacz: Nowy najlepszy gracz w szachach to nieustraszony algorytm swashbuckling

Jako nie-ekspert w dziedzinie szachów i sztucznej inteligencji w szachy, moje założenie było takie, że w oparciu o wydajność AlphaGo i walidację tego rodzaju metody w odniesieniu do gier kombinatorycznych było to, że starsza sztuczna inteligencja nie miałaby szans.

  • Dlaczego zwycięstwo AlphaZero było zaskakujące?

Odpowiedzi:


14

Dobre pytanie.

Przede wszystkim najważniejsze jest to, że w Go Deepmind nie miał nadludzkich przeciwników. Silniki Go nie były nigdzie w pobliżu najwyższego poziomu najlepszych ludzi. Jednak w szachach silniki są o 500 punktów ELO silniejsze niż najlepsi gracze. To ogromna różnica. Ogrom pracy włożony we współczesne silniki szachowe jest oszałamiający. Mówimy o milionach godzin programowania, setkach tysięcy iteracji. To ogromny zasób wiedzy i pracy. Przezwyciężenie i przekroczenie tego w 4 godziny jest oszałamiające.

Po drugie, nie tyle sam wynik jest zaskakujący dla szachowych mistrzów, ale raczej sposób, w jaki AlphaZero gra w szachy. To dość ironiczne, że system, który nie posiadał ludzkiej wiedzy ani doświadczenia, gra tak jak my. Silniki są znane z wykonywania brzydko wyglądających ruchów, tych, którym brakuje harmonii itp. Trudno to wytłumaczyć graczowi niebędącemu szachami, ale istnieje coś takiego jak „sztuczny ruch”, jak często wymyślają współczesne silniki. AlphaZero wcale tak nie gra. Ma bardzo ludzki styl, w którym dominuje pionki przeciwnika dzięki głębokiej grze strategicznej i ofiarom z oszałamiającej pozycji. AlphaZero gra w sposób, do którego dążymy, łącząc głębokie zrozumienie pozycji z precyzją obliczeń silników.

Edytuj Oh i zapomniałem wspomnieć o samym wyniku. Jeśli nie znasz szachów komputerowych, może się to nie wydawać oszałamiające, ale tak jest.

Obecnie margines zwycięstwa, jaki dzieli najlepsze współczesne silniki, jest cienki jak brzytwa. W meczu na 100 gier można spodziewać się wyniku, takiego jak 85 remisów, 9 zwycięstw i 6 strat w celu ustalenia lepszego silnika.

AlphaZero 28 wygranych i 72 remisy z zerowymi stratami było nieziemskim miażdżeniem i było całkowicie nie do pomyślenia aż do momentu, gdy to się stało.


Niezła odpowiedź. Twoja uwaga na temat porównania między szachami AI jest interesująca pod względem ograniczenia opartego na zapętleniu szachów i triadzie wygranej / przegranej / remisu. (Być może w przyszłości będziemy potrzebować skończonych, trudnych gier, które umożliwią bardziej szczegółową analizę pod względem wyników.) Znam historię silników szachowych oraz ogromną ilość wysiłku i ludzkiej wiedzy, które się w nich znalazły, ale kontekst braku sukcesu w związku z tym: znacznie bardziej skomplikowany Go 19x19 Go miał dla mnie przeciwne konsekwencje.
DukeZhou

W szczególności moje założenie było takie, że jeśli AlphaGo może pokonać najlepszych ludzi w znacznie bardziej złożonej grze, wydawałoby się rozsądne, że pokonałaby nie tylko najlepszych ludzi, ale także poprzednie poprzednie AI w każdej innej grze.
DukeZhou

Trochę na temat sztucznych ruchów jest dość ważne i nie jest to coś, o czym mówiłem graczom niebędącym szachami. +1
Stella Biderman

4

MCTS dla szachów został wypróbowany w literaturze z niewielkim powodzeniem. Zakładano, że podejście AlphaGo nigdy nie zadziała w szachach, może w Go, ale nie w szachach. Nagle Google ogłosiło, że to podejście działa i pokonuje najsilniejszy program szachowy na świecie z bardzo charakterystyczną przewagą.

Przed Google wszyscy programiści szachowi uczyli się heurystyki w programowaniu silników, która była lepszą strategią niż uczenie maszynowe. Bez względu na to, jak zaimplementowałeś sieci neuronowe, nigdy nie działałoby to szybciej niż kilka 64-bitowych instrukcji dotyczących bitboardów. AlphaGo działało dość wolno , ale grało w najsilniejsze szachy.


2

Widzę, na podstawie dostarczonych artykułów, wiele poziomów zaskoczenia w zwycięstwie:

Szachy są trudne do opanowania, a część przeciwna miała najlepsze światowe praktyki, AlphaZero miała tabula rasa.

Nauka zajęła cztery godziny, a AlphaZero nie przegrał meczu 100.

Styl gry był obcym połączeniem ludzkich i komputerowych ruchów, agresywnych i czasami wydawało się głupich z poświęceniami, które nie mają pojęcia, ale w rzeczywistości wzmacniają przyszły status.

Ilość możliwości branych pod uwagę na ruch była mniejsza niż część przeciwna, AlphaZero miał tajemnicze przeczucie lub intuicję.

Niepokój wynikał z ilości materiału treningowego, z którego zbudowała się AlphaZero, oraz z limitu czasu, który może nie dawał tradycyjnej maszynie sporego czasu.


Aaa Wynikało to z braku zaufania do nowej metody sztucznej inteligencji. To ma sens.
DukeZhou
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.