Anlässlich dieses Threads von Brettspiel Dude ... da gings dann ja auch um Lektüre ... und dazu wollte ich noch ne Kleinigkeit erklären ... und dann hab ich eine ziemliche Wall of Text produziert. Da das die dortige Diskussion etwas verlässt, wird das jetzt ein eigener Thread. Mehr oder weniger darüber, was Spieltheorie denn so mit unseren Brettspielen zu tun hat und warum die uns bei der Strategieentwicklung gar nicht so viel weiterhilft.
Hier wurde ja mal der Wunsch für mehr Beiträge mit Strategie gewünscht …das hier ist quasi ein Meta-Strategie-Thema. Und überhaupt … andere Nutzer schreiben hier ja auch hin und wieder Intellektuelles über Filme, ich versuche mich jetzt mal mit "Intellektuelles über Mathe". (Ohne Formeln. Eher einfache Sprache. Also ... für eventuell anwesende Mathematiker: Keine Vorfreude!)
Außerdem noch ein Hinweis vorweg: Ich hab mich niemals beruflich mit Spieleentwicklung, Spieltheorie, Entscheidungstheorie, ... beschäftigt. Ich schreib das jetzt mehr oder weniger aus dem Kopf mit kleinen Wikipedia-Spickereien ... also ... gerne berichtigen.
Am Anfang muss ich leider etwas ausholen...
Worum geht es in der Spieltheorie und der Entscheidungstheorie?
In der Entscheidungstheorie geht es darum, möglichst gute Entscheidungen zu treffen. Logisch. Nur eben auf strukturierte, methodische Weise. Mit der Hilfe dafür entwickelter Modelle und Methoden. Mit unvollständiger Information, mit zukünftigem Zufall, und weiteren Komplikationen. Und mit einem messbarem Nutzen. Also wenn man die Ausgangssituation kennt, kann man die Auswirkung einer Aktion, einer Entscheidung (eines Spielzugs), damit klar messen. Das gibt es bei der Spieltheorie alles auch. Der Unterschied ist nur, dass es in der Spieltheorie noch Mitspieler gibt, die auch Aktionen machen. Und deren Aktionen für mich zwar nicht zufällig, aber eben auch nicht vorhersehbar sind, und die meine Entscheidungen beeinflussen.
Ziel der Spieltheorie ist es eigentlich, "Lösungen" für Spiele zu finden, also dominante Strategien mit denen man immer gewinnt bzw. nie verliert. Für 4-Gewinnt oder Mühle gibt es zum Beispiel solche Lösungen. Wendet man das auf ökonomische Situationen an, ist es oft das Ziel, einen Punkt zu finden, an dem sich alle als Gewinner fühlen, also jemand nicht besser da stünde, wenn dieser Jemand nur für sich etwas besser gemacht hätte. (Das heißt dann Nash-Gleichgewicht, darum ging es im Film A Beautiful Mind.)
Nur (gute) Brettspiele ... werden normalerweise so designed, dass es keine "Lösungen" gibt (weil langweilig -- jemand der die Lösung kennt würde immer gewinnen) und eben auch keine Nash-Gleichgewichte. (Weil ... es sollte ja immer auch Mitspieler geben, die gerade nicht am gewinnen sind und sich noch verbessern können. Sonst wärs auch langweilig und man kann aufhören.)
Wie bei der Entscheidungstheorie gibt es bei der Spieltheorie eine Nutzenfunktion (auch Auszahlungsfunktion), die den Spielerfolg misst, also ... im Standard-Euro-Fall, die Siegpunkte. Und man hat eine gegebene Ausgangssituation (also den Zustand, des Spieltischs), eine Erinnerung (was bisher so auf dem Spieltisch geschah) und Aktionsmöglichkeiten. Und jetzt kann man den Nutzen der verschiedenen Aktionen messen. Macht man die Aktion gibt's Siegpunkte, bei der anderen Aktion gibt's in der aktuellen Situation mehr Siegpunkte, also ist die besser. Nur ... jetzt könnte mir die erste Aktion ja in der Zukunft mehr Siegpunkte ermöglichen ... und hier hilft uns in der mathematischen Theorie jetzt Wahrscheinlichkeitsrechnung, Kombinatorik und Induktion weiter.
Also ... angenommen, du hast irgendein normales Brettspiel vor dir. Das hat begrenztes Material, eine begrenzte Anzahl Spielzüge, also kann es nicht unendlich viele Zustände annehmen. Es ist also kombinatorisch durchrechenbar. Mit einem (entsprechend krassem ) Computer könnte man jede erlaubte Kombination von Spielzügen und Zufallsereignissen (Würfelwürfe) erzeugen und bewerten.
Jetzt gehen wir mal in die letzten Züge einer Partie. Oft kann man hier seine Siegpunkte und das Endergebnis bzgl. der unterschiedlichen Aktionen schon ausrechnen. (Ausrechnen schließt natürlich Erwartungswerte von den noch ausstehenden Zufällen mit ein.) Also ... im Grunde sind das langweilige Entscheidungen. Man muss es ja nur "schnell" ausrechnen. Gegebenenfalls freut man sich dabei wie Bolle, weil alles so gut funktioniert hat oder es ist noch spannend, weil der Gewinner noch nicht "ausgerechnet" ist ... aber als Entscheidung an sich ... ist der letzte Spielzug langweilig, man wählt nur den besten zur Verfügung stehenden Spielzug aus. Das kann man ja für alle Möglichkeiten für das Spielbrett vor dem Ende mal machen. (Wir haben ja theoretisch den krassen Computer .) Und jetzt kann natürlich auch den vorletzten Zug ansehen und genauso behandeln. Und danach habe ich je wieder eine Spielsituation vor dem letzten Zug, die haben wir gerade alle ausgerechnet und müssen jetzt nur den vorletzten Zug auswählen, der zu der Spielsituation mit dem besten möglichen letzten Zug führt. (Der Ansatz hat auch in der Praxis Relevanz: Im Schach gibt es doch eine sogenannte Tablebase, wo alle Endspielsituation mit bis zu sieben Spielfiguren vollständig kombinatorisch aus analysiert sind.) Also ist der vorletzte Zug als Entscheidung auch langweilig?
Mal sehen. Denn: Macht man das immer so weiter, steht man irgendwann ganz am Anfang. Und ... am Anfang sollte herausfinden, dass alle (oder einige) Züge gleich gut sind, weil sonst gäbe es ja eine dominante Strategie und das wäre dann ein schlechtes Spiel und mögen wir Spieler ja nicht. Aber ... nur ganz am Anfang. Nachdem erste Zufallsentscheidungen getroffen wurden ... zum Bespiel eine zufällige Startauslage erstellt wurde, sieht das schon wieder ganz anders aus. Hier könnte es bereits eine dominante Strategie geben. Aber ... wir Menschen (und auch die meisten Computer) können gar nicht schnell genug nachrechnen, daher kennen wir die dominante Strategie nicht. Und nach jedem neuen Zug, jedem neuen Zufallsereignis, stellt sich diese Frage nach der jetzt besten Strategie, dem besten Zug erneut. Dadurch, dass uns Spiel jede Menge Dinge gibt unsere Entscheidung abzuwägen, sich die Erwartungen an den Nutzen (Siegpunkte zum Spielende) ändern und wir das alles nicht so genau wissen, entsteht ja erst der Spielspaß.
Wie treffen K.I.s, also so ein mathematisches, technisches Dingsbums Entscheidungen?
Zuerst formuliert man mathematisch eine Aufgabe, also meistens: Maximiere die Siegpunkte. Oder genauer: Maximiere die Siegpunkte unter der Nebenbedingung, dass ich auch am meisten habe. (Oder zumindest eine möglichst gute Platzierung.) Schließlich ist es Spielregel, dass jeder versucht zu gewinnen.
Und gerade habe ich ja erklärt, dass wir das ganze Spiel durchrechnen können ... wir setzen einfach die aktuelle Spielsituation (und das Gedächtnis) in die gerade beschriebene Methodik ein und der super-krasse Computer sollte den absolut besten Zug berechnen können. Das gilt aber meistens nur theoretisch. Beim Schach, dem vermutlich am meisten berechneten Spiel der Welt, klappt das in der Praxis immer noch nicht. Deswegen setzt man da Heuristiken ein.
Also das ist einfach eine andere, viel einfachere Funktion, die nur einige der Merkmale der Spielsituation (und des Gedächtnisses) berücksichtigt und versucht trotzdem die am meisten Siegpunkte produzierende Aktion auszuspucken. Das ist ein klassisches Problem, welches mit verschiedenen Methoden der K.I. lösen kann. Weil ... auch K.I. muss man trainieren. Die K.I. bekommt Daten von Spielen (oder produziert sie durch Spielen mit sich selbst) und erkennt hinterher, welche Aktionen in der jeweiligen Spielsituation nützlicher waren. Das K.I.-Training erstellt Korrelationen von Merkmalen der Spielsituation und korreliert diese mit dem Gewinnen. Und bei der K.I. ist der Trick: Das Trainieren und Überprüfen ist verdammt aufwendig, aber die Anwendung später ist einfach. Das kann dann auch das Handy, während für das Training noch ein stärkerer Computer notwendig war.
Und unser Hirn macht ja bei Lernen und Üben eigentlich das Gleiche. Wenn wir irgendwann ein gutes Bauchgefühl für eine Spielsituation haben, wenden wir eigentlich eine Heuristik in unserem Kopf an. Bei "Bauchspielern" wird diese weniger hinterfragt oder mit "Nachrechnen" überprüft, analytische Spieler "rechnen" da gerne noch ein paar Zwischenergebnisse aus, oder bauen mehr bewusste "Wenn-Dann"-Entscheidungen in ihre Heuristik ein. Und wie wir ein Spiel wahrnehmen ... hängt eben total an diesen Heuristiken. Ein guter Schachspieler weiß intuitiv ob eine Stellung unklar ist oder eine Seite am Gewinnen, er weiß außerdem welche Züge im Moment auf natürliche Weise in Frage kommen (was man im Blitzschach spielen würde) und kann bei langem Nachdenken doch oft noch bessere, stille Züge finden, die aber nicht unbedingt die besten Züge sein müssen. Lässt man zwei Schachprogramme gegeneinander antreten passiert das gleiche. Beide "rechnen" nicht alles mit Brute-Force in die Tiefe, sondern sie wenden auch Heuristiken für die Verbesserung der Stellung an. Das Programm mit den besseren Heuristiken gewinnt. Und Schach ist Zufallsfrei und somit gut berechenbar. Kommen da Zufallsereignisse hinein wird die Heuristik immer wichtiger. (Falls jemand das Handy-Spiel Threes! kennt und liebt ... diesen Blog-Artikel zu einer K.I. für Threes! fand ich lesenswert und er betont ebenfalls die Wichtigkeit der Bewertungsheuristik der Spielsituation.)
Also Heuristiken ... die Krux ist die Bewertung der Spielsituation
Jetzt ... nachdem ich die Heuristik erklärt habe ... kann ich dazu mal ein paar Gedanken teilen:
- Warum können wir viele Euros in der ersten oder zweiten Partie schon ziemlich sinnvoll spielen? Weil wir in der Lage sind unsere Erfahrung von bereits bekannten Mechanismen aus anderen Euros auf das neue Spiel zu übertragen. Das klappt oft schon während der Erstpartie. Extrembeispiel sind vielleicht die diversen Rosenberg'schen Landwirtschaftseuros. Oder die 18xx Familie.
- In unseren Köpfen lassen wir bei den Euros gerne die Nebenbedingung "mehr Siegpunkte als die Anderen" weg. Bei nicht so interaktiven Euros funktioniert das ganz wunderbar. Da lerne ich quasi, dass es quasi das Gleiche ist. Schließlich kann ich mit meist mehr Punkte auf alle Anderen gewinnen, als ich einem einzelnem Mitspieler weg nehmen kann. Auch vergleicht man gerne nur die absolut erreichten Siegpunkte als Güte des Ergebnisses. Wie aggressiv in der Partie etwas weggenommen wurde, wird unter "Euro-Spielern" nicht immer so wahrgenommen.
- Spielt man dann Blood Rage oder Food Chain Magnate(?) oder Kemet, wird die Nebenbedingung wichtiger und rückt bei Kemet sogar direkt in den Vordergrund. Und für das Lernen von "gutem Spiel" ist das schwieriger. Weil ... die Lösung, welches ist der beste Zug, ist hier viel chaotischer in der Auswirkung. Eine falsche Entscheidung wirkt sich stärker auf, eine kleine Änderung erfordert möglicherweise einen anderen Spieler plötzlich voll anzugreifen (oder auch nicht). Denn ... den Führenden einbremsen ist offensichtlich. Aber wann und wie stark, damit ich am meisten profitiere und nicht ein lachender Dritter ist schon sehr schwierig. Eine dazu erlernte Heuristik vermutlich ziemlich fehlerhaft.
- In Pax Pamir ist das noch schwieriger, weil es mit nämlich keine stringenten Wege zum Ziel vorgibt. Die Möglichkeit Siegpunkte zu erhalten ist da in der Schwebe. Ich kann entweder dafür sorgen, dass es wahrscheinlicher wird, dass meine Seite gewinnt oder dass ich bei meiner Fraktion der Stärkste bin. Oder gewinnt eine andere Fraktion? Das Spiel ist komplett labil bzgl. wer aktuell im Vorteil ist. Das schwierig zu berechnen. In Root ist es ähnlich. Ich muss die unscheinbare, aber Raketen-mäßig punktende Waldlandallianz mit der Polizei-Fraktion der Katzen abwägen ... sehr schwierig, weil es sich durch Kleinigkeiten schnell ändern kann.
- Schach an sich ist ein eher einfaches Zufalls-Freies Spiel. Trotzdem ist das Bewerten wer im Vorteil ist oft sehr schwierig und kann sich schnell ändern.
Das führt für mich zur folgenden Schlussfolgerung:
Als normaler, erfahrener Spieler kommen wir mit dem Zufall und der Zukunft ganz gut klar. Wir können Würfelwurfe abschätzen, kennen gegebenenfalls Kartenverteilungen, können verbleibende Aktionen oder verbleibendes Geld abzählen ... und kommen damit immer gut klar, so lange wir entweder für uns selbst das beste rausholen sollen oder jemand anders (dem Führenden) gezielt beschneiden wollen. Was uns aber Probleme macht, ist das Einschätzen der Spielsituation, wenn der Vorteil schwer zu bestimmen ist und äußerst schnell verspielt sein kann. Dann habe ich kein "ungefähr gut" mehr. Sondern ich verhalte mich wie eine richtig schlechte K.I. Mal mache ich einen guten Zug, dann wieder einen katastrophalen Fehler. Weil diese eben nah beieinander liegen. (Und das habe ich jetzt nicht nur aus Brettspiel Dude und seinen Problemen mit Pax Pamir geschlossen, sondern eben auch dadurch, dass niemand wirklich erklären kann, wie man solche Spiele "gut" spielt. Und für diese Bewertung braucht man eben auch die Erfahrung in diesem Spiel-System. Da helfen einem Erfahrungen aus anderen Spielen viel weniger weiter.
Mir hilft bei dieser Betrachtung durchaus auch ein Konzept der Spieltheorie, nämlich das Gleichgewicht. Das Gleichgewicht ist dabei, dass die Chancen aller Spieler gerade ausgeglichen sind, dass es für keinen Spieler eine dominante Strategie gibt, welche die Anderen kaum verhindern können. Wenn ein Spieler am Gewinnen ist, verschiebt sich das Gleichgewicht in dessen Richtung. Dann geht man auf den Führenden. aber um das möglichst früh zu erkennen, kann man sich immer fragen "Wo ist gerade das Gleichgewicht?" oder auch "Wer hat die besten Chancen?". Und dann auf Möglichkeiten hin spielen dies später zu korrigieren.
Funfacts
- Am Ende eines 18xx kann es zu einem Nash-Gleichgewicht kommen. Nämlich dann, wenn keiner sein Aktienportfolio oder seine Streckennetze verbessern kann. Das kann in der letzten Phase vor dem Platzen der Bank passieren. Ist hier nicht schlimm, weil man muss dann halt noch ein bis zwei Runden durch passen bis die Bank tatsächlich geplatzt ist. Ist hier nur Verwaltungsaufwand, spielerisch passiert dann nichts relevantes mehr. Soweit ich es bisher mitbekommen habe, ist es gegen Spielende schon in der Nähe eines Nash-Gleichgewichts üblich das Spiel einfach fertig abzurechnen ohne noch relevante Aktionen zu machen.
- Ich rede hier die ganze Zeit nur von nicht-kooperativer Spieltheorie. Es gibt aber auch kooperative Spieltheorie. Aber die hat mehr mit Verhandlungen zu tun. Seitdem frage ich mich ob Siderische Konfluenz das Musterbeispiel für kooperative Spiele in der Brettspielwelt ist? (Solo- und Koop-Spieler werden übrigens von der Entscheidungstheorie alleine schon ausreichend bedient und "brauchen" die Spieltheorie gar nicht.)
Habe fertig