1.e2-e4?
Den Doppelschritt eines Bauern hatte Mir Sultan Khan noch nie gesehen, als er sich Ende der 1920er in England mit dem Schach vertraut machte, wie es in Mitteleuropa gespielt wurde. In Indien spielten sie Schach damals noch anders. Sultan Khan lernte flugs die hiesigen Regeln, dann besiegte er Capablanca, Rubinstein und weitere Weltklassespieler. Ende 1933 ging er zurück nach Indien. Nie wieder wurde er an einem Schachbrett gesichtet.
Für dieses Aufflackern eines neuen Schachsterns, gefolgt vom Verschwinden desselben, finden wir in der Schachgeschichte eine Parallele, und die spielt Ende 2017. Das Schachprogramm AlphaZero kannte nur die Regeln, als es begann, binnen neun Stunden 40 Millionen Partien gegen sich selbst und andere zu spielen. Danach gewann es einen Wettkampf gegen Stockfish, das beste Schachprogramm bis dahin. Und wurde nie wieder beim Schachspielen gesichtet.
Abseits der Parallele gibt es einen wesentlichen Unterschied. Sultan Khan war auf Anhieb Weltklasse, unter den zehn besten Spielern des Planeten. AlphaZero war viel besser, und das in einem Maße, dass uns sein Schach ganz neue Einsichten gewährt, wie das Spiel abläuft, wenn es nahe an der Perfektion gespielt wird. AlphaZero hat uns gelehrt, dass über dem tiefen taktischen Schach herkömmlicher Maschinen, bis dahin das Maß aller Dinge, noch eine Ebene existiert, die des Strebens nach positioneller Dominanz ungeachtet materieller Erwägungen.
Anders als Mir Sultan Khan ist AlphaZero jetzt wieder aufgetaucht, und das in Person seines Schöpfers. Demis Hassabis, Chef der Google-Firma DeepMind, die AlphaZero entwickelt hat, war jetzt zu Gast bei der Schach-WM. Er führte den ersten Zug der siebten Partie aus, danach stand er im Studio Judit Polgar und Anna Rudolf Rede und Antwort, musste aber schnell weg.
Als tags darauf die achte Partie anstand, war AlphaZero gleich doppelt dabei. Demis Hassabis kam zurück ins Studio, um all die noch offenen Fragen zu beantworten, während auf dem Brett AlphaZeros kleine Schwester Leela mitmischte. Mit der hatte nämlich Fabiano Caruana jenes Sizilianisch-Abspiel vorbereitet, das Carlsen erhebliches Kopfzerbrechen und eine Stellung am Rande des Verlustes bescherte. Nun sahen die Zuschauer die Auswirkungen des Umstands, dass bei diesem WM-Match erstmals neuronale Netze auf beiden Seiten mitspielen.
Wie AlphaZero Züge findet, versteht nicht einmal sein Schöpfer
Als Caruana das Ende seiner Vorbereitung erreicht hatte, stand er überlegen, vermochte aber auf sich allein gestellt nicht, diesen Vorteil in einen vollen Punkt umzumünzen. Und das, obwohl die Denkprozesse eine neuronalen Netzes eher denen von Menschen gleichen als denen eines herkömmlichen Rechenknechtes wie Stockfish. Wie Menschen orientiert sich AlphaZero an Mustern, die es im Lauf der Matches gegen sich selbst gelernt hat, und das frei von starren Regeln.
Demis Hassabis erklärt das so: “AlphaZero bewertet alles im Kontext der aktuellen Position. Den Wert von Figuren, Turm fünf Bauern, Springer drei, kennt es nicht. Darum fällt es ihm zum Beispiel leichter, langfristig aus positionellen Gründen eine Qualität zu opfern. Stockfish kann das zwar auch, aber die Materialbilanz von minus zwei zwingt es, so tief rechnen, dass es einen konkreten Vorteil sieht.”
Bald ein neues AlphaZero-Match?
Wie genau AlphaZero und Leela ihre übermenschlichen Manöver aushecken, kann allerdings nicht einmal der Schöpfer von AlphaZero erklären. “Für den Moment ist das noch eine Art Black Box. Wir wissen es nicht.” Das solle sich aber ändern. DeepMind plant, die Algorithmen von AlphaZero Stück für Stück zurückzubauen, um besser zu verstehen, wie die Entscheidungsprozesse der Software ablaufen. Schließlich geht es der Firma weniger um Schach und mehr um eine bessere Welt. AlphaZero und seine Verwandten aus dem Google-Labor sollen helfen, wissenschaftliche Probleme zu lösen, etwa auf dem Feld der Medizin.
Wer nun erwartet hatte, dass mit dem Verschwinden Hassabis’ vom Londoner Schlachtfeld nun auch AlphaZero wieder verschwinden würde, den belehrte Hassabis eines Besseren. Sein Unternehmen habe weitere Pläne für AlphaZero und werde diese bald ankündigen. Womöglich wird das Google-Programm ja ein Match unter ernsthaften Turnierbedingungen spielen? Hassabis ließ durchblicken, dass er gerne objektiv abschätzen können würde, wie stark genau sein maschineller Schützling ist. “Wahrscheinlich um Elo 3.600, aber um das herauszufinden, müssten wir AlphaZero noch einmal spielen lassen.”
Konkrete Einblicke verspricht allemal ein Buch, dessen Erscheinen der englische Großmeister Matthew Sadler anlässlich des Hassabis-Besuchs in London ankündigte. Sadler gehört zum auserwählten Kreis derjenigen, die mehr als die zehn bislang veröffentlichten AlphaZero-Partien kennen und Zugang zu den Entwicklern hatte. Mit seiner Co-Autorin Natasha Regan erforschte Sadler die Geschichte hinter der Geburt des Programms und beleuchtet dessen Partien. Im März 2019 soll “Game Changer” erscheinen.
[…] beim Frage-Antwort-Spiel mit DeepMind-Chef Demis Hassabis, dem Polgar und Moderatorin Anna Rudolf die Geheimnisse von AlphaZero entlockten – die Ungarin agierte so souverän, als sei der Platz im Studio vor der Kamera ihr […]
[…] des WM-Matches zwischen Magnus Carlsen und Fabiano Caruana hatte Demis Hassabis angekündigt, dass weitere AlphaZero-News in der Mache sind. Nun hat die Zeitschrift Science das komplette DeepMind-Papier veröffentlicht (inklusive […]
[…] im Hintergrund Schach spielende neuronale Netze als Analysehelfer mit von der Partie waren. Im Vordergrund tummelte sich AlphaZero-Entwickler Demis Hassabis, Chef der Google-Tochter DeepMind, der am Rande des Matches Einblicke in die Entwicklung von […]