Kaum fassbar gut, göttlich noch nicht: AlphaZero demontiert Stockfish – schon wieder

Der Menschheit gibt AlphaZero eine Ahnung davon, was künstliche Intelligenzen zu leisten vermögen. Selbst die Felder der Intuition und Kreativität sind den Maschinen nicht verschlossen. Vorerst gilt das nur für Schach und andere Strategiespiele, aber wohin diese Reise führen mag, welche Felder die Maschinen noch beackern werden, das weiß nicht einmal Demis Hassabis, Chef der Google-Tochter DeepMind. Hassabis wähnt sich noch an der Startlinie.

In unserer kleinen Schachwelt ist das Ziel fast erreicht, die dritte maschinelle Revolution  fast vollzogen, und sie wird wahrscheinlich die letzte sein. So tief und unergründlich das Schach sich für den menschlichen Geist auch darstellt, die Maschinen haben es fast entschlüsselt. Wir wissen jetzt, dass Schach in letzter Konsequenz eben doch ein Strategie- und kein Taktikspiel ist.

leelahassabis.jpg
“Ein Sprungbrett auf dem Weg zur allgemeinen künstlichen Intelligenz”: DeepMind-Chef Demis Hassabis beim WM-Match in London. (Foto: Worldchess)

AlphaZero hat zwar noch Luft nach oben, es könnte noch ein wenig stärker sein, speziell im Endspiel (siehe weiter unten), aber es wird keine neue Maschinengeneration kommen, die noch einmal alles Dagewesene übertrumpft, noch einmal ganz neue Konzepte einführt, noch höhere Ebenen des Strebens nach schachlicher Perfektion offenbart. Dafür ist unser Spiel mit seinen fast unendlichen Möglichkeiten eben doch zu begrenzt und nun aus maschineller Sicht fast ausgereizt. Darum wird AlphaZero jetzt nach und nach auf das große Spiel des Lebens losgelassen – mit ungewissem Ausgang.

Werbung

Verschwörungstheorien um AlphaZero

Als vor genau einem Jahr DeepMind das Ergebnis eines Matches gegen Stockfish veröffentlichte, brauchten Schachspieler einige Zeit, um den Gehalt der zehn öffentlichen Partien zu verdauen, denn die zu verstehen, bedeutet Arbeit. Selbst als sich herauskristallisierte, dass die Google-Maschine dem Schach zu einem evolutionären Sprung verholfen hatte, wollten die Traditionalisten ihren guten, alten Stockfish nicht abschreiben. Denn den hatte DeepMind beim ersten Maschinenmatch arg beschnitten. Monatelang befeuerten Verschwörungstheoretiker die Annahme, Hassabis und sein Team hätten erst geschummelt und dann AlphaZero demontiert, damit ihnen niemand auf die Schliche kommt.

schritthuber.jpg
Österreichischer Kopf hinter AlphaZero: Nach dem Schach-Experiment lässt Julian Schrittwieser seine Entwicklung jetzt Proteine falten.

Aber so wichtig ist Schach für die Londoner Entwickler, darunter der Österreicher Julian Schrittwieser, nun einmal nicht. Schach ist für sie der erste kleine Probierstein, dem viel größere Brocken folgen sollen. Bevor sie ihre Entwicklung Proteine falten ließen, wollten sie erst einmal sichergehen, dass der erste Sieg über Stockfish kein Zufall war. Und sie ließen AlphaZero noch einmal auf dem Computerschachweltmeister los, dieses Mal unter gleichen Bedingungen. Mit einem ähnlichen Ergebnis: AlphaZero gewinnt deutlich, ob mit oder ohne Eröffnungsbuch, sogar mit Zeitvorgabe.

Ein Jahr später: das komplette AlphaZero-Papier

Schon am Rande des WM-Matches zwischen Magnus Carlsen und Fabiano Caruana hatte Demis Hassabis angekündigt, dass weitere AlphaZero-News in der Mache sind. Nun hat die Zeitschrift Science das komplette DeepMind-Papier veröffentlicht (inklusive aller Partien). Unter anderem unsere Freunde von chess.com haben zusammengefasst, unter welchen Bedingungen sich A0 und Stockfish dieses Mal beharkt haben, mit welchen Ergebnissen und welche Tendenzen sich dabei gezeigt haben. Großmeister Matthew Sadler zeigt derweil auf dem chess24-Youtube-Kanal ausgewählte Partien, nicht im Detail, aber er beleuchtet Wendepunkte und zeigt überraschende und unkonventionelle Ideen.

tweet sadler.png
“Game Changer” heißt Matthew Sadlers Buch über AlphaZero, das im Januar 2019 erscheinen soll. Der Titel ist doppeldeutig. Nicht nur im Feld der Künstlichen Intelligenz, ja, nicht einmal nur im Feld des maschinellen Schachs krempelt die DeepMind-Maschine alles um. Auch für Menschen womöglich, denn die sollen lernen, was sich AlphaZero selbst beigebracht hat.
stockfish.png
Das erste Match zwischen AlphaZero und Stockfish barg einige Momente, die nicht nur bei Verschwörungstheoretikern Stirnrunzeln verursachten. Diesen zum Beispiel.

Die Stockfish-Freunde geben sich derweil noch nicht geschlagen. AlphaZero hat sich mit Stockfish 8 und 9 auseinandergesetzt, nicht mit der neuesten Version 10, die seit einigen Tagen zum Download bereitsteht. Tatsächlich ist Stockfish 10 noch einmal deutlich stärker geworden als seine Vorgänger, und das in einem Maße, dass anhand des Ergebnisses von Version 8 gegen die DeepMind-Maschine rechnerisch seine Spielstärke etwa der von AlphaZero entsprechen müsste.

Wir dürfen zwar vermuten, dass das in der Praxis anders aussähe, nur fehlt dafür der Beweis. Ein Match Stockfish 10 versus AlphaZero wird es eher nicht geben, und so müssen wir uns noch ein wenig gedulden, bis sich Leela, der AlphaZero für alle, in die Spielstärkesphären ihres großen Bruders aus dem Google-Labor emporgeschwungen hat.

Stockfish ist 1.000-mal schneller, im Endspiel zählt das

Sicher ist, dass AlphaZero noch längst nicht wie Gott spielt, speziell in der späten Partiephase. Je weniger Steine auf dem Brett stehen, desto eher profitieren traditionelle Maschinen von ihrer Rechenpower, und desto eher mag der vergleichsweise langsam und selektiv rechnende AlphaZero ins Straucheln geraten.

alphadia.jpeg
Wenn Weiß nichts macht, ist die Stellung leicht remis. Aber AlphaZero wollte partout gewinnen, und das ging nach hinten los.

Dieses Endspiel entstammt der einzigen Partie, die AlphaZero mit Weiß verloren hat. Was erstaunlich ist, weil Weiß so eine Stellung nur verlieren kann, wenn er sich selbst umbringt, indem er die Gewinnversuche überzieht. Und genau das passierte.

Wenn Weiß ein Remis will, muss er einfach gar nichts mehr tun. Schwarz wird dann keine Fortschritte machen können, das sieht sogar ein Mensch sofort. Aber AlphaZero wollte mehr und übersah gegen den etwa 1.000-mal schneller rechnenden Stockfish eine taktische Abwicklung. Bei seinen Versuchen, irgendwie einen vollen Punkt zu ergattern, vergeigte die Maschine die Partie. Sie weiß ja nicht, dass traditionelle Rechner so eine Stellung bis fast zum Ende komplett durchrechnen können und annähernd unfehlbar sind.

0 0 votes
Article Rating
Abonnieren
Benachrichtige mich bei
guest
6 Comments
Most Voted
Newest Oldest
Inline Feedbacks
View all comments
Ferdi
3 Jahre zuvor

@Ultiko Grundsätzlich hast Du Recht. Wenn man aber Stockfish die Eröffnungsdatenbank und die Endspieldatenbank wegnehmen würde, wäre dann nicht A0 im Vorteil? Denn in gewisser Weiser hat sich doch A0 sowohl eine Eröffnungsdatenbank als auch eine Endspieldatenbank in der Lernphase, also beim Spielen von 44 Millionen Partie gegen sich selbst, mit Hilfe von Google´s Hochleistungsrechnern beigebracht und im neuralen Netzwerk abgespeichert. Mann kann die beiden System eben nur schwer miteinander vergleichen. Das finde ich ja gerade so interessant an dem Duell: Die völlig konträren Ansätze. Auf der einen Seite SF (stellvertretend für alle anderen klassischen Engines wie Komodo, Houdini, Fritz… Weiterlesen »

Ferdi
3 Jahre zuvor

Kaum fassbar gut finde ich Eure Seite! Ich bin eher Zufällig auf Eure Seite gestoßen. Nämlich auf der Suche nach neuen Infos´s zu A0. Das war kurz bevor DeepMind die restlichen Partien und den weiteren Erfolg gegen SF veröffentlicht hatte. Eure Seite finde ich großartig. Ein wahre Perle. Ich bin Froh, diesen Schatz für mich entdeckt zu haben. Ich bin aber auch sehr beeindruckt von AlphaZero und auch von dessen Partien. Zuvor hatte ich schon mit großem Interesse die furiosen Erfolge von DeepMind im Go verfolgt. Aber Schach interessiert mich nunmal deutlich mehr 😉 Die im Beitrag genannte Verlustpartei von… Weiterlesen »

Ulriko
Ulriko
3 Jahre zuvor

“Bestimmt könnten die sich einer Endspieldatenbank annähern, vielleicht auch einfach eine implementieren, aber das würde ja das Gesamtkonzept verhöhnen” – wenn man es für eine Verhöhnung hält, wenn ein Programm nicht mehr rechnet, sondern auf eine abgespeicherte Lösung zurückgreift, ja, aber es ist nicht mehr oder weniger eine “Verhöhnung” als bei den klassischen Schachprogrammen, die ja das Gleiche tun – sie hören auf zu rechnen, sobald es eine perfekte Lösung in der Endspieldatenbank gibt. Insofern geht es doch nur darum, was das Ziel ist: Die Spielmethodik (also die Engines) zu vergleichen – dann müssen die verglichenen Programme beide ohne Eröffnungs-… Weiterlesen »

wk
wk
3 Jahre zuvor

Der revolutionäre Ansatz von A0 besteht darin, kein zusätzliches “externes” Schachwissen beizusteuern – abgesehen von der Definition des Regelwerks. Damit wäre eine Eröffnungs- oder Endspieldatenbank nicht in Einklang. Man sollte auch betonen, dass es überhaupt nicht das Ziel von Google Deepmind ist, ein möglichst gutes Schachprogramm zu erzeugen. Es geht um die Entwicklung eines selbstlernenden Systems zur Lösung regelbasierter Problemstellungen. Schach, Go und Chinesisches Schach sind da nur willkommene Übungsfelder. Wenn ich die Berufsbezeichnung “Sachbearbeiter” hätte, würde ich mir Sorgen um meinem Job machen … Für mich hat es den Anschein, als würde A0 bewusst Remis ausweichen, vermutlich mittels eines… Weiterlesen »

Ferdi
3 Jahre zuvor
Reply to  wk

Das sehe ich auch so. Das Open-Source-Projekt Leela soll ja an ein eine Endspieldatenbank angebunden werden, was aber offenbar technisch sehr aufwendig ist und aus meiner Sicht dem Ansatz völlig zu wider laufen würde. Die verlorenen Endspiele in klarer Remis-Stellung sind ja gerade nicht mit einem Contempt-Faktor erklärbar, da A0 ja außer den Spielregeln nichts implementiert wurde. Die Endspielschwäche ist für mich noch am ehesten mit der ggü. SF deutlich geringen Anzahl berechneter Positionen, der fehlenden Endspieldatenbank und der fehlenden „Spielpraxis“ erklärbar. 44 Millionen Partien klingt viel; im Schachuniversum ist das aber nichts. Die Verlustpartie finde ich auch sehr bemerkenswert.… Weiterlesen »