Soziales Dilemma und Allmendeproblem in Experimenten der Spieltheorie

 

Spieltheorie


Soziale Dilemmata liegen immer dann vor, wenn erstens der persönliche egoistische Nutzen höher liegt als der persönliche geteilte Nutzen, egal, was die anderen machen, und zweitens dieses egoistische Verhalten zu einer Reduzierung des Gesamtnutzens führt. Es besteht die Versuchung zur Handlung A, während alle (oder die meisten) mit der Handlung B erfolgreicher wären.
Die Spieltheorie und Experimente hierzu versuchen reale Situationen zu simulieren und zu verstehen.

Das "Gefangenendilemma"-Spiel wurde bereits vorgestellt. Bei Dawkins wurde, mit dem Bestreben, "altruistisches" Verhalten in der Tierwelt zu erklären, in computergesteuerten Spielserien gezeigt, dass kooperative Strategien in gewissen Fällen evolutionär erfolgreicher sein können (s. Evolution des Sozialverhaltens im Tierreich) (1).

 
                                Investorenspiel
Auszahlungen: links Investor / rechts Unternehmer
investierter Betrag (x) wird verdreifacht; weitere Erläuterungen im Text
Quelle: Nach E. Ostrom (2)

Das "Investorenspiel", eine Variante der asymmetrischen Vertrauensspiele, ist rechts dargestellt. Es gibt zwei Positionen, die des "Investors" und die des "Unternehmers". Im dargestellten Beispiel, das mit Studenten einer US-amerikanischen Universität gespielt wurde, erhält der Investor 10 $, von denen er einen Betrag (x) dem Unternehmer geben kann. Dieser "erwirtschaftet" 200 % Rendite (3x). Er kann dem Investor einen beliebigen Betrag (y) zurückzahlen.   
Basisversion:
Die Spielpartner sind einander unbekannt und anonym; es wird nur eine Runde gespielt.
Ergebnis: 92 % der Investoren schicken einen Betrag (durchschnittlich 5,20 $), 60 % der Unternehmer schicken mehr als 1 $ zurück (durchschnittlich 4,70 $), davon ein Drittel mehr als den erhaltenen Betrag.
Investoren, die mehr als 5 $ investiert hatten, erzielten durchschnittlich eine positive Rendite, während investierte Beträge kleiner als 5 $ im Mittelwert nicht vollständig zurückgezahlt wurden.
Nach dem Modell des "rationalen Egoisten" wäre zu erwarten gewesen, dass kein Investor Geld gäbe, da er mit Null Rückgabe rechnen muss, und dass kein Unternehmer etwas zurückgeben würde. Ganz im Widerspruch zu dieser Erwartung wurden hohe Einsätze (d. h. gezeigtes Vertrauen) mit hoher Rückgabe (Erwiderung des Vertrauens) belohnt.
Eine vergleichende Länderstudie zwischen China, Japan, Korea und USA ergab keine signifikanten Unterschiede.
1. Variante - Wiederholung:
Es werden zwei Runden gespielt.
Ergebnis: In der ersten Runde wird mehr investiert und mehr zurückgezahlt; die zweite Runde verläuft jedoch weniger vertrauensvoll und ähnlich wie in Variante 1.
2. Variante - Sanktionsmöglichkeit:
Wie Basisversion, zusätzlich zum investierten Betrag wird vom Investor ein gewünschter Rückgabebetrag kommuniziert. 
Zur Einforderung dieses Wunschbetrages ist für den Investor die Option auf eine Strafe von 4 $ möglich, die von ihm angekündigt werden muss.
Die Graphik unten zeigt die Ergebnisse mit Ausübung der Strafoption (rosa), ohne Ausübung der Strafoption (grün) und ohne Strafmöglichkeit (grau, Kontrollversuch).
Man liest ab, dass alle Investoren zwischen 2 und 10 $ einsetzten, und dass die Rücktransferbeträge überproportional stiegen (vgl. das ähnliche Ergebnis der Basisversion). Auffallend ist jedoch vor allem, dass die ausgeübte Strafoption (d. h. Äußerung von Mißtrauen) zu geringeren Rücktransfers als im Kontrollversuch führte, wohingegen der Verzicht auf eine mögliche Strafoption (d. h. Ausdruck von Vertrauen) durch "freiwillige" höhere Rückzahlungen honoriert wurde.
Dieses Phänomen wird von Elinor Ostrom als konform mit Feldbeobachtungen gesehen, wo z. B. die Verstaatlichung eines Urwaldes, mit externen Aufsehern, zu einer höheren Abholzrate führen kann, als dies vorher bei einer lokalen Selbstverwaltung - ohne Strafmechanismus - der Fall war.

 
                                             Investorenspiel
3. Variante, Erläuterungen s. Text
Quelle: Nach E. Ostrom (2)

 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
Als allgemeine Interpretation lässt sich ableiten, dass die in der neoklassischen Wirtschaftslehre weitverbreitete Grundannahme des "homo oeconomicus", der rational und egoistisch auf transparenten und perfekt funktionierenden Märkten agiert, das menschliche Verhalten zum Beispiel in Sozialen-Dilemma-Situationen nicht vollständig beschreibt.



Eine öffentliche Ressource ist ein Gut, von der Natur oder vom Menschen geschaffen, dessen Nutzung, wenn es erst einmal zur Verfügung steht, schwierig zu kontrollieren ist, und das sich durch Nutzung verbraucht.
Darunter fallen ein Ozean, ein Wald, die Atmosphäre, aber auch die Sauberkeit eines Stadtparks, die Sicherheit einer Wohngegend oder die Stabilität einer Währung, wenn man davon ausgeht, dass gefangener Fisch, abgeholzte Bäume, abgegebene Schadstoffgase, Abfall, Einbrüche und Bereicherung jeweils kumulative Effekte sind, deren Summe in gewisser Höhe die Ressource in ihrer Qualität oder ihrer Existenz bedrohen.

Das "Allmendespiel" soll diesen Aktionsraum in einer Versuchsanordnung abbilden.
In der Basisversion gibt nur eine Position, die des "Aneigners". Jeder Spieler einer Gruppe erhält pro Runde eine Anzahl von 10 Werteinheiten (gedanklich als Tagesarbeitsstunden vorstellbar), die er zur Ausbeutung der Ressource (Fischen, Holzfällen) einsetzen kann oder alternativ für eine Lohnarbeit. Die Lohnarbeit wird nach Stunden bezahlt, die Ausbeutungsarbeit nach dem Bruchteil vom Gesamteinsatz der Gruppe, multipliziert mit einer Funktion, die die Belastbarkeit der Ressource abbildet. D. h. je mehr Arbeitseinheiten in die Ressourcenausbeutung gesteckt werden, desto mehr sinkt der Wert der einzelnen Arbeitsstunde (je stärker ein Fischfanggebiet überfischt ist, desto geringer ist der Fangerfolg pro Stunde).
Es spielen 8 Teilnehmer in 20 bis 30 Runden. Im Gegensatz zur Realität ist in jeder neuen Runde die Ressource wieder vollständig vorhanden, d. h. eine Übernutzung tritt ggf. in jeder Runde und sofort in Wirkung. Die Gesamtressourcennutzung - nicht aber die Nutzung der einzelnen Teilnehmer - wird kommuniziert.
Die Parameter sind so gewählt, dass ein "rational-egoistisches" Verhalten zu einem Einsatz von 8 Einheiten für die Ressource und 2 Einheiten für die Lohnarbeit führen würde, mit einem Gewinn von 66 $ je Runde. Das kooperative Optimum läge bei Einsätzen von 4,5 Einheiten für die Ressource und 5,5 Einheiten für die Lohnarbeit, bei einem Gewinn von 91 $ je Runde.
Ergebnis: Es wurden durchschnittlich 37 % des Maximums erreicht (d. h. sogar weniger als für das "egoistische" Verhalten), und die Werte oszillierten stark und durchgängig.
Eine nachträgliche Befragung der Teilnehmer zu ihren Strategien legte offen, dass häufig jeweils und ausschließlich aufgrund der Vorrunde entschieden wurde; z. B. "die Ausbeutung erhöhen, wenn in Vorrunde Stundenertrag der Ressource höher war als Stundenlohn". Dieser Typ einfacher Strategien erklärt die nicht endenden Oszillationen und die regelmäßige Übernutzung.
1. Variante - Kommunikation:
Nach jeder Runde kann die Gruppe kommunizieren (um z. B. Strategien zu besprechen und Ausreißerverhalten - das nur in Form der Gesamtausbeutungsinformation vorliegt - zu kritisieren).
Ergebnis: Nahezu 100 % des Maximums, 5 % Ausreißer (Abweicher von der besprochenen Strategie).
Offenbar findet eine Normenbildung, durch Diskussion des Verhaltens Dritter und Anpassung des eigenen Verhaltens, statt.
2. Variante - Arm und Reich:
Es gibt zwei Positionen, "arme" und "reiche" Aneigner. Sie können 8 bzw. 24 Werteinheiten pro Runde einsetzen.
Ergebnis: Ohne Kommunikation 49 % des Maximalergebnisses, mit Kommunikation nahe dem Optimum (sofern die Positionen durch Auktion verteilt wurden, bildete sich eine bimodale Verteilung mit durchschnittlich je 6 bzw. 10 für die Ressource eingesetzten Einheiten; d. h. die "Reichen" setzten im Konsens nicht das Dreifache, sondern nur knapp das Doppelte für die rentablere Ressourcenausbeutung ein als die "Armen").
Über die Strategiediskussion der 1. Variante hinaus war die "Gerechtigkeitsfrage" zu klären, bevor soziale Vertrauensnormen aufgebaut werden konnten, was offenbar auch gelang.
3. Variante - Außenseiter:
Zwei von acht Spielern sind von der Kommunikation ausgeschlossen, und dürfen (a) beliebige Beträge oder (b) Beträge zwischen 4 und 12 Einheiten für die Ressourcenausbeutung einsetzen.
Ergebnis: Im Fall (a) schafften es nur 31 % der Gruppen, gemeinsame Strategien zu entwickeln, in diesen gab es durchschnittlich 50 % Abweichungen. Im Fall (b) vereinbarten nahezu alle (98 %) Gruppen Strategien, und die Zahl der Abweichungen betrug 16 %.
Die Unsicherheit, dass einige Spieler (ein Viertel) sich sicher nicht an Regeln halten würden, reduzierte die Bereitschaft zu gemeinsamem Handeln drastisch. Die mangelnde Kontrolle - zu hoher Einsatz konnte stets auf die zwei externen Spieler als Sündenböcke geschoben werden - verringerte zudem den normativen Druck zum vereinbarten Handeln innerhalb der Gruppe.
4. Variante - externe Bestrafungsregel:
Wie Variante 2, jedoch werden Einzelergebnisse mitgeteilt, und Spieler können nach festen Regeln auf eigene Kosten über beliebige andere Spieler Strafen verhängen (die etwa 2-4 mal so hoch sind wie die eigenen Kosten des Strafers).
Ergebnis: Ohne Kommunikation werden 39 % (0  %) des Maximums erzielt, mit Kommunikation 85 % (69 %). Der Wert in Klammern ist das Ergebnis nach Abzug der Strafkosten (Kosten für den Anzeigenden und Strafe selbst).
Die Ergebnisse sind, auch vor Abzug der Strafkosten, (geringfügig) schlechter als ohne externes Strafsystem.
5. Variante - interne Bestrafungsregel:
Die Gruppe entscheidet vor dem Spiel über Strategie und über Strafsystem (Kosten und Strafhöhe).
Ergebnis: Vier von sechs Gruppen legen ein Strafsystem fest (mit Strafen zwischen 10 und 100 $). Diese erzielen ein Ergebnis von 93 % (mit 4 % Vertragsbrüchen), wohingegen die anderen zwei Gruppen ein Ergebnis von 56 % erreichen, mit 42 % (unbestraften) Abweichungen.
Im experimentellen Umfeld schaffen es einige Gruppen, Sanktionsentscheidungen herbeizuführen; diese haben einen deutlich höheren Erfolg.
Im Sinne des weiter oben geschilderten institutionellen Ansatzes stellt die Gruppendiskussion zu Beginn der Spielrunden einen Aktionsraum auf Verfassungsebene dar ("Wir bilden eine beschlussfähige Gruppe" und gleichzeitig auf Gemeinschaftsebene ("Wir beschließen Regeln"). Die Fähigkeit, diese Gelegenheit zu nutzen, reproduziert sich auf der Einzelebene (Beachtung von Normen und Regeln).

Der Ersatz persönlicher durch elektronische Kommunikation verschlechterte die Ergebnisse.

Ein Ländervergleich zwischen US-Studenten und Einwohnern eines (ländlichen) kolumbianischen Dorfes zeigte keine signifikanten Unterschiede.
Jedoch schnitten kolumbianische Gruppen mit eigener Bewirtschaftungserfahrung gemeinsamer Ressourcen besser ab, während Gruppen mit größeren sozialen Unterschieden zwischen den Gruppenmitgliedern schlechtere Ergebnisse erzielten.
6. Variante - externe Kontrolle und Bestrafung:
Es wird vorgeschrieben, nur den "optimalen" Ausbeutungsaufwand zu betreiben. In jeder Runde werden 6 % aller Spieler nach dem Zufallsprinzip kontrolliert und bei Überschreitung bestraft.
Ergebnis: Die Zahl der Übertretungen nimmt zu, das Gruppenergebnis sinkt.
Auch dies zeigt als Beispiel, dass externe Kontrollen, die sich der Selbstorganisation der Gruppe entziehen, auf die Bildung sozialer Normen innerhalb der Gruppe einen negativen Einfluss haben kann. 



Quellenangaben
(1) R. Dawkins, "The Selfish Gene" (Oxford University Press, 1976)
(2) E. Ostrom, "Understanding Institutional Diversity" (Princeton: Princeton University Press, 2005)



nächste Seite: Werte
vorherige Seite: Institutionen