From Zero to Hero.

Submitted by drupaladmin on Do, 02/01/2018 - 07:51

Schachengines haben Schach revolutioniert.

Freie Engines wie Stockfish ermöglichen es heute jedem Spieler weltweit seine Partien bestmöglich zu analysieren oder auch nur einfach gegen einen übermenschlichen Gegner trainieren zu können. Schachengines haben das Spiel verändert. Zum einen in der Eröffnung, indem es leichter geworden ist Neuerungen zu finden und sie auszuprobieren oder auch in der Verteidigung schwieriger Stellungen. Wo Partien früher noch aufgegeben wurden, hat man heute vom Computer gelernt, wie man immer neue Ressourcen in der Defensive finden und dem Gegner das Leben schwer machen kann.

Diese Engines basieren auf Stellungsbewertungen und dann brutaler Rechenleistung. Millionen Stellungen pro Sekunde werden bewertet, nach Kriterien, die sich in Jahrhunderten menschlichen Schachspielens entwickelt haben. Entwickler solcher freier, kostenloser Engines sind moderne Schachhelden, auch wenn es so manchen Schachspieler nervt, wenn Stockfish sie auf dem Brett mal wieder fertig macht oder die gefühlte Meisterpartie "niederanalysiert".

Jahrelang ist in dem Bereich nichts Aufregendes mehr passiert, bis letzten Dezember Google kam mit AlphaZero.

2014 kaufte Google die Firma Deepmind für eine unbekannte astronomische Summe. Deepmind beschäftigt sich mit künstlicher Intelligenz und versucht neuronale Netze per Computer nachzubilden, es geht also ein bisschen darum das menschliche Gehirn abzubilden verbunden mit den Speicher- und Rechenleistungen eines Computers. Es geht um Zukunftsfelder, es geht darum sich als führendes Softwareunternehmen zu platzieren um später Aufträge auf nationaler Ebene abzuschließen. Roboter, selbstfahrende Autos, computergestütze Dienste jeglicher Art, bei Google geht es definitiv nicht um "frei und kostenlos".

Deepmind entwickelte Programme, die Computerspiele wie Menschen spielen konnten. Man gab ihnen nur die Grundregeln vor, danach trainierten sie sich selbst und lernten dann eigenständig das Spiel zu spielen. So ging man auch mit dem Programm AlphaZero vor, dem man nur die Schachregeln vorgab. Aber keine Stellungsbewertungen, auch keine Eröffnungsbibliotheken, gar keinen menschlichen Input der Schacherfahrungen der letzten Jahrhunderte. Das Programm trainierte einfach gegen sich selbst, schaute welcher Verlauf ein günstiges Ende nahm und baute sich ein neuronales Netz auf mit sinnvollen Zügen. Es braucht dann auch nicht millionen Stellungen durchzurechnen, von denen eh die meisten sinnlos sind, sondern berechnet pro Sekunde "nur" rund 80.000 Stellungen. Das ist eigentlich ein recht menschlicher Ansatz.

AlphaZero trainierte 9 Stunden auf einer Google-Rechnerfarm mit über 5000 Prozessoren und spielte zwischendurch immer eine Blitzpartie mit einer Sekunde Bedenkzeit gegen Stockfish. Nach rund 4 Stunden hatte AlphaZero dann bereits die Spielstärke von Stockfish erreicht. In einem abschließenden Wettkampf über 100 Partien gewann AlphaZero dann bei einer Minute Bedenkzeit pro Zug mit 28 Siegen, 72 Remis und ohne Niederlage überdeutlich gegen Stockfish. Ein Stockfish, das einen geschätzten ELO von 3400 hat.

10 Partien wurden veröffentlicht, die zum Teil ein faszinierendes Angriffsspiel von AlphaZero zeigen. Es wird geopfert, es wird dominiert, aktives Figurenspiel vom Feinsten. Viele haben es mit dem risikoreichen Kombinationsspiel Michail Tals verglichen. Und das alles, ohne das irgendein Schachgroßmeister AlphaZero Tricks verraten hätte, das Programm hat es sich alles selbst beigebracht/hergeleitet.

Ist es wirklich besser als Stockfish? Vermutlich eher nicht. Die Hardware und die Einstellungen waren nicht gerade optimal für Stockfish, zudem ließ man es ohne Eröffnungsbibliothek oder Endspieldatenbank spielen, dafür ist Stockfish aber optimiert. AlphaZero hatte eine Eröffnungsbibliothek, wenn auch die selbst antrainierte. Aber in den veröffentlichten Partien sieht man häufiger, dass Stockfish schon in der Eröffnung schlecht spielt und folgerichtig später immer mehr dominiert wird und verliert. Weder Stockfish mit den genutzen Einstellungen noch AlphaZero haben also wirlich wie ELO 3400 gespielt. Trotzdem war es faszinierend.


Euer Rafael.