AlphaZero-Show beim WM-Match

1.e2-e4?

Den Doppelschritt eines Bauern hatte Mir Sultan Khan noch nie gesehen, als er sich Ende der 1920er in England mit dem Schach vertraut machte, wie es in Mitteleuropa gespielt wurde. In Indien spielten sie Schach damals noch anders. Sultan Khan lernte flugs die hiesigen Regeln, dann besiegte er Capablanca, Rubinstein und weitere Weltklassespieler. Ende 1933 ging er zurück nach Indien. Nie wieder wurde er an einem Schachbrett gesichtet.

leelaalpha.png
Die weltweit beste Quelle für ausführlich und in aller Tiefe kommentierte AlphaZero-Partien (in Deutsch und Englisch) ist wahrscheinlich die Partiedatenbank der “Perlen vom Bodensee”. Im März könnte sich das ändern. Dann erscheint das Buch “Game Changer” über die Google-Maschine (siehe weiter unten).

Für dieses Aufflackern eines neuen Schachsterns, gefolgt vom Verschwinden desselben, finden wir in der Schachgeschichte eine Parallele, und die spielt Ende 2017. Das Schachprogramm AlphaZero kannte nur die Regeln, als es begann, binnen neun Stunden 40 Millionen Partien gegen sich selbst und andere zu spielen. Danach gewann es einen Wettkampf gegen Stockfish, das beste Schachprogramm bis dahin. Und wurde nie wieder beim Schachspielen gesichtet.

Werbung

Abseits der Parallele gibt es einen wesentlichen Unterschied. Sultan Khan war auf Anhieb Weltklasse, unter den zehn besten Spielern des Planeten. AlphaZero war viel besser, und das in einem Maße, dass uns sein Schach ganz neue Einsichten gewährt, wie das Spiel abläuft, wenn es nahe an der Perfektion gespielt wird. AlphaZero hat uns gelehrt, dass über dem tiefen taktischen Schach herkömmlicher Maschinen, bis dahin das Maß aller Dinge, noch eine Ebene existiert, die des Strebens nach positioneller Dominanz ungeachtet materieller Erwägungen.

Anders als Mir Sultan Khan ist AlphaZero jetzt wieder aufgetaucht, und das in Person seines Schöpfers. Demis Hassabis, Chef der Google-Firma DeepMind, die AlphaZero entwickelt hat, war jetzt zu Gast bei der Schach-WM. Er führte den ersten Zug der siebten Partie aus, danach stand er im Studio Judit Polgar und Anna Rudolf Rede und Antwort, musste aber schnell weg.

leelahassabis.jpg
Was Caruanas Vorgabe “1.e4” bedeutete, war für Demis Hassabis beim Ausführen des ersten Zugs leicht zu entschlüsseln. Der Chef der Google-Tochter DeepMind ist selbst ein starker Schachspieler. Nach dem Eröffnungszug plauderte er bei der Live-Show mit Judit Polgar und Anna Rudolf aus dem AlphaZero-Nähkästchen. (Foto: Worldchess)

Als tags darauf die achte Partie anstand, war AlphaZero gleich doppelt dabei. Demis Hassabis kam zurück ins Studio, um all die noch offenen Fragen zu beantworten, während auf dem Brett AlphaZeros kleine Schwester Leela mitmischte. Mit der hatte nämlich Fabiano Caruana jenes Sizilianisch-Abspiel vorbereitet, das Carlsen erhebliches Kopfzerbrechen und eine Stellung am Rande des Verlustes bescherte. Nun sahen die Zuschauer die Auswirkungen des Umstands, dass bei diesem WM-Match erstmals neuronale Netze auf beiden Seiten mitspielen.

Wie AlphaZero Züge findet, versteht nicht einmal sein Schöpfer

Als Caruana das Ende seiner Vorbereitung erreicht hatte, stand er überlegen, vermochte aber auf sich allein gestellt nicht, diesen Vorteil in einen vollen Punkt umzumünzen. Und das, obwohl die Denkprozesse eine neuronalen Netzes eher denen von Menschen gleichen als denen eines herkömmlichen Rechenknechtes wie Stockfish. Wie Menschen orientiert sich AlphaZero an Mustern, die es im Lauf der Matches gegen sich selbst gelernt hat, und das frei von starren Regeln.

carlsen close.jpg
Knapp konnte sich Magnus Carlsen in der achten Partie des WM-Matches aus Leelas Würgegriff befreien, als auf der anderen Seite des Brettes Fabiano Caruana am Ende seiner Vorbereitung auf sich allein gestellt war. (Illustration: Willum Morsch)

Demis Hassabis erklärt das so: “AlphaZero bewertet alles im Kontext der aktuellen Position. Den Wert von Figuren, Turm fünf Bauern, Springer drei, kennt es nicht. Darum fällt es ihm zum Beispiel leichter, langfristig aus positionellen Gründen eine Qualität zu opfern. Stockfish kann das zwar auch, aber die Materialbilanz von minus zwei zwingt es, so tief rechnen, dass es einen konkreten Vorteil sieht.”

Bald ein neues AlphaZero-Match?

Wie genau AlphaZero und Leela ihre übermenschlichen Manöver aushecken, kann allerdings nicht einmal der Schöpfer von AlphaZero erklären. “Für den Moment ist das noch eine Art Black Box. Wir wissen es nicht.” Das solle sich aber ändern. DeepMind plant, die Algorithmen von AlphaZero Stück für Stück zurückzubauen, um besser zu verstehen, wie die Entscheidungsprozesse der Software ablaufen. Schließlich geht es der Firma weniger um Schach und mehr um eine bessere Welt. AlphaZero und seine Verwandten aus dem Google-Labor sollen helfen, wissenschaftliche Probleme zu lösen, etwa auf dem Feld der Medizin.

leelagamechanger.png
Der Titel trifft es. Was AlphaZero auf dem Brett zeigt, wird unser Verständnis des Spiels auf eine neue Stufe heben. Bald werden wir mehr Partien der Google-Maschine kennen. Matthes Sadler und Natasha Regan hatten exklusiven Zugang zum DeepMind-Schachlabor.

Wer nun erwartet hatte, dass mit dem Verschwinden Hassabis’ vom Londoner Schlachtfeld nun auch AlphaZero wieder verschwinden würde, den belehrte Hassabis eines Besseren. Sein Unternehmen habe weitere Pläne für AlphaZero und werde diese bald ankündigen. Womöglich wird das Google-Programm ja ein Match unter ernsthaften Turnierbedingungen spielen? Hassabis ließ durchblicken, dass er gerne objektiv abschätzen können würde, wie stark genau sein maschineller Schützling ist. “Wahrscheinlich um Elo 3.600, aber um das herauszufinden, müssten wir AlphaZero noch einmal spielen lassen.”

Konkrete Einblicke verspricht allemal ein Buch, dessen Erscheinen der englische Großmeister Matthew Sadler anlässlich des Hassabis-Besuchs in London ankündigte. Sadler gehört zum auserwählten Kreis derjenigen, die mehr als die zehn bislang veröffentlichten AlphaZero-Partien kennen und Zugang zu den Entwicklern hatte. Mit seiner Co-Autorin Natasha Regan erforschte Sadler die Geschichte hinter der Geburt des Programms und beleuchtet dessen Partien. Im März 2019 soll “Game Changer” erscheinen.

0 0 votes
Article Rating
Abonnieren
Benachrichtige mich bei
guest

3 Comments
Most Voted
Newest Oldest
Inline Feedbacks
View all comments
trackback

[…] beim Frage-Antwort-Spiel mit DeepMind-Chef Demis Hassabis, dem Polgar und Moderatorin Anna Rudolf die Geheimnisse von AlphaZero entlockten – die Ungarin agierte so souverän, als sei der Platz im Studio vor der Kamera ihr […]

trackback

[…] des WM-Matches zwischen Magnus Carlsen und Fabiano Caruana hatte Demis Hassabis angekündigt, dass weitere AlphaZero-News in der Mache sind. Nun hat die Zeitschrift Science das komplette DeepMind-Papier veröffentlicht (inklusive […]

trackback

[…] im Hintergrund Schach spielende neuronale Netze als Analysehelfer mit von der Partie waren.  Im Vordergrund tummelte sich AlphaZero-Entwickler Demis Hassabis, Chef der Google-Tochter DeepMind, der am Rande des Matches Einblicke in die Entwicklung von […]