Das zu Google gehörende Unternehmen DeepMind verfolgt das
Ziel eine generelle KI zu erschaffen. Ein Zwischenziel auf diesem Weg wurde im
Januar mit dem Vorstellung von AlphaStar erreicht, einer KI, die professionelle
Spieler in Starcraft II besiegt hat.
Starcraft ist einer der Echtzeitstrategiespiel, erschienen
in 2010 und gehört zu den wichtigsten Titeln im E-Sport weltweit. In Turnieren
und Ligen wird regelmäßig um Preisgelder in Millionenhöhe gespielt.
Gegenüber den bisher von DeepMind umgesetzten Agenten für
Schacht oder das Brettsiel Go muss AlphaStar mit deutlich größeren
Herausforderungen umgehen. Dazu zählen imperfekte Informationen über das
Spielgeschehen – die Aktionen des Gegners können in der Regel nicht eingesehen
werden – und ein sehr großer Handlungsraum.
Das Training
Soweit bekannt wurde die Umsetzung als Deep Reinforced
Learning betrieben und das Training in mehreren Instanzen durchgeführt. Das initiale
Trainingsset bestand aus aufgezeichneten Partien aus professionell
durchgeführten Matches und Spielen gegen einen Mitarbeiter von DeepMind. Da
diese Datenbasis nicht ausreichend ist, traten im Anschluss verschieden
Varianten von AlphaStar gegeneinander an. So kam das Equivalent von 200 Jahren
Spielzeit zusammen und es entwickelten sich verschieden Ausprägungen des
Agenten, die unterschiedliche Spielweisen an den Tag legten.
Die Einschränkungen
Das Training wurde auf einer der vielen in Starcraft möglichen
Karten und mir einem Ausschnitt der möglichen Einheiten durchgeführt. AlphaStar
ist dahingehend eingeschränkt. Zudem wurde die Anzahl der möglichen Aktionen
pro Zeit auf das für professionelle Spielern mögliche Maß begrenzt.
Die Spiele
Es wurde jeweils fünf Matches gegen zwei Spieler als Turnier
ausgetragen und ein zusätzliches Live Spiel im Stream. Dabei trat ein zufällig
gewählter Agent aus den Top 5 der Trainingsliga.
Bemerkenswert ist die Tatsache, dass sich die Agenten in
ihrer Spielweise von menschlichen Spielern unterschieden. Ungewöhnliche
Strategien, die von den Kommentatoren anfangs an nicht sinnvoll angesehen
wurde, führten häufig zum Gewinn der KI.
Zusätzlich zu der guten Strategie hat der Computer Vorteile
aus der präzisen Steuerung einzelner Einheiten gezogen. Das geschickte
Ausweichen und koordinierte Angreifen von duzenden Einheiten kann so von menschlichen
Spielern kaum umgesetzt werden.
Erfolgte ein Angriff, so wurde er in der Regel auch gewonnen.
Und so kam es zu einem klaren Endergebnis von 10 – 1 für AlphaStar.
Fazit
Die KI hat auf dem Niveau von professionellen menschlichen
Spielern gespielt und dabei Strategien gefunden, die in vielen Jahren der
Optimierung in Ligen und Turnieren bisher nicht angewandt wurden. Kombiniert
mit der ungeteilten Aufmerksamkeit auf das gesamte Spielgeschehen und der
Unberechenbarkeit von fünf stark unterschiedlich agierenden Agenten konnte sich
die KI klar durchsetzen.
Unbesiegbar ist sie jedoch unter gegebenen Limitierungen
nicht und es wäre jetzt spannend zu sehen wie sich menschliche Akteure auf die
neue Spielweise anpassen.
Die Matches und weitere Hintergrunderklärungen der Entwickler können hier im Video angesehen werden:
https://youtu.be/cUTMhmVh1qs