Łatwo jest wskoczyć na modę, mówiąc, że gra Alpha-Zero jest „bardziej” ludzka niż poprzednie programy szachowe, jak wskoczyć na przeciwny wóz i powiedzieć, że gra Alpha-Zero jest całkowicie „obca”. Nie jest jasne, że gra Alpha-zero jest „bardziej ludzka”, szczególnie biorąc pod uwagę naszą ludzką tendencję do antropomorfizmu.
Szachy jako walka (ludzkiego) umysłu
Ale czy w szachach ta tendencja jest prawdziwa? Magnus Carlsen powiedział kiedyś o tym, jak ogólnie „tradycyjnym” komputerom brakuje ludzkiej kreatywności, mówiąc:
„W szachy chodzi o walkę między ludzkimi umysłami. To sprawia, że jest ekscytujący. Szachy komputerowe są mechaniczne, suche i nijakie. Ruchy są oczywiście bardzo silne, ale nie ma stylu. Jeśli spróbujesz grać przeciwko komputerowi szachowemu , nie tylko przegrasz z bardzo dużą pewnością, ale również będziesz się nudzić.
Magnus Carlsen nie widział dowodów na ludzkie style gry w tradycyjnych komputerach szachowych. Sprawdźmy więc, czy ostatnie osiągnięcie Alpha-Zero odwróciło tę perspektywę i przesunęło nas w stronę czegoś bardziej przypominającego nas samych.
Jeśli przez „ludzki” rozumiesz zabawę wykazującą zachowania bardziej skłonne do odwołania się do naszego poczucia antropomorfizmu, to czy styl alfa-zero wydaje się bardziej ludzki? Jak naprawdę testujemy tych subiektywnych krótkowzrocznych ludzi, którzy lubią rzutować na rzeczy inne niż ludzkie? Zapytajmy - czy algorytm „selektywnie wybiera lepszy”, czy wykazuje „bardziej ludzki twórczy wybór” w swoim stylu gry?
Twórcy algorytmu wskazują, że w przeciwieństwie do Sztokfiszy, która korzysta z algorytmu wyszukiwania Alpha-Beta, Alpha-Zero wykorzystuje algorytm wyszukiwania drzewa Monte-Carlo (MCTS), który przyjmuje jako dane wejściowe ważone parametry θ zbudowane z poprzednich wyników ~ Strona 3. Opanowanie szachów i Shogi przez samodzielną grę z ogólnym algorytmem uczenia się zbrojenia ).
Algorytm wcale nie wykazuje wyboru. W rzeczywistości angażuje się on w losowe, ale probabilistyczne wyszukiwanie Monty-Carlo, w którym możliwe ścieżki wyszukiwania są coraz bardziej naruszane przez poprzednie wyniki. Czy Alpha-zero zdecydowało się zoptymalizować swój styl gry w ten sposób, czy był to wybór jego programistów?
Czy alfa-zero zawsze ma do dyspozycji wszystkie możliwe ruchy do rozważenia, czy też niektóre ruchy są zniekształcone algorytmicznie w sposób naśladujący doświadczenie, które ludzie mogą interpretować antropomorficznie?
Początkowo miał do dyspozycji wszystkie ruchy, więc jego „styl” był całkowicie losowy. Jednak, ponieważ jego wyszukiwanie jest coraz bardziej i optymalnie ograniczone poprzednim sukcesem lub porażką, jego styl zmienia się w kierunku trybu, w którym programiści go związali. Czy to jednak „bardziej ludzkie”? Porównaj to z Magnusem Carlesenem, który czasami wybiera mniej optymalne ruchy, ponieważ są bardziej kreatywni :
Magnus Carlsen: „Doceniam tworzenie czegoś wyjątkowego”
Szachy jako walka umysłu (obcego)
Ludzie mogą wybrać kryteria, które kierują ich własnym stylem gry (na przykład często wybrałem impuls i błąd we własnym stylu). Gra w szachy i wiele zarówno zobaczyć Alpha-Zero jest iść jako zdecydowanie Alien . Nick Hynes, student w MIT's Computer Science and Artificial Intelligence Laboratory (CSAIL), zauważa:
„To, co widzimy tutaj, to model wolny od ludzkich uprzedzeń i założeń: może nauczyć się wszystkiego, co określa jako optymalne, co może być bardziej zróżnicowane niż nasze własne koncepcje tego samego. To jak obca cywilizacja wymyślająca własną matematykę, która pozwala jej na takie rzeczy jak podróże w czasie ... ”
Podobnie GM Peter Heine Nielsen powiedział Chess.com :
„Po przeczytaniu gazety, ale szczególnie po obejrzeniu gier, pomyślałem, no cóż, zawsze zastanawiałem się, jak by to było, gdyby wyższy gatunek wylądował na ziemi i pokazał nam, jak grają w szachy. Teraz już wiem.”
Wydaje się, że większość reaguje na powstający styl gry Alpha-zero jako „grę obcych”, a nie jako „bardziej ludzką”.
Dlatego istnieje powód, by nie zgadzać się z powyższymi odpowiedziami, które mówią „tak”.