Wird die Menschheit das Jahr 2100 noch erleben?
Eine Berechnung anhand von Spamfilter-Technologie
Die Computerei ist das aktuelle Beispiel – Viren, Trojaner und anderes machen "Intrusion-Detection-Systeme" notwendig: Wir müssen uns vor den Angriffen von außen schützen. Für eine E-Mail werden zahlreiche Schutzmechanismen eingesetzt. Wenn wir den Absender nicht kennen, kommen weitere Vorsichtsmaßnahmen hinzu. Und schließlich werden nicht so eindeutige Spammails sicherheitshalber in einem Fach abgelegt, das wir dann auf "falschen Spam" manuell prüfen. Das Geheimnis dieses Sortiervorganges verbirgt sich hinter einer Formel, die bereits vor mehr als 300 Jahren das Licht der Welt erblickte, nämlich dem Bayeschen Theorem.
Was in der Computerwissenschaft funktioniert, kann offenbar auch bei subjektiven Entscheidungen angewandt werden. D. Prelec vom Massachusetts Institute of Technology sieht dazu in seinem Beitrag "A Bayesian Truth Serum for Subjective Data" in Science einen bemerkenswerten Ansatz.
Wenn ein Befragter wahrheitsgemäß eine Antwort abgibt, werden daraus weder die vorherige oder nachträgliche Verteilung berechnet, sondern lediglich die Antwort und ihre voraussichtliche Wahrscheinlichkeit gewertet. D. Prelec besteht auf einer wahrheitsgemäßen Beantwortung seiner Fragen. Was er dann tut, ist die Zusammenfassung aller Antworten, die als Summenwert zwar mehr wert sind als die einzelne Antwort, und doch weniger als die korrekt berechnete Wahrscheinlichkeit. Gleichwohl besitzt sie für seine Frage einen ausreichenden Informationsgehalt.
Im Buch, "Our Final Century" von M.Rees wird die Chance, dass die Menschen das Jahr 2100 überleben, mit 50:50 bewertet (M.Rees: Our Final Century, Heinemann, London 2003). Daraus leitet D. Prelec die Frage ab: "Werden die Menschen das Jahr 2100 noch erleben?"
Die grafische Darstellung illustriert den Wert dieses Gedankenganges. Die Kurve A90 zeigt, dass die Katastrophe für den Menschen eine Wahrscheinlichkeit von 90 Prozent hat, unabhängig davon, ob die Voraussetzung mit 50 Prozent (A90) oder 20 Prozent (B90) angenommen wird. Ähnliches verrät die Formel von D. Prelec, indem die "korrekten" Antworten die Kurve PS90 ergeben. Diese Kurve läuft parallel zu den vorherigen, ist aber unabhängig zu den a-priori Ereignissen, die nicht erfasst werden.
Dasselbe gilt ebenso für Fragen aus der Vergangenheit oder nahen Zukunft. "Hattest Du mehr als 20 Sexualpartner im vergangen Jahr?" oder "Ist Picasso Dein Maler des 20. Jahrhunderts?". Oder gar die in den USA wichtige Frage: "Wirst Du bei der nächsten Präsidentenwahl wählen?", die hier mit unterschiedlichen Resultat, nämlich Ja, Nein, wahrscheinlich nicht, und definitiv nicht beantwortet werden kann. Denn einerseits zählt die richtige Antwort auf eine genaue Frage und zum anderen die empirische Verteilung der Antworten. Die Voraussagen werden auf ihre Genauigkeit geprüft, nämlich wie oft sie zutreffen.
Einen wesentlichen Anteil an den Überlegungen hat dabei das Nash-Gleichgewicht. John Forbes Nash, ein mit dem Nobelpreis ausgezeichneter Mathematiker, hat das Strategieprofil bei Spielern analysiert. Ein wesentlicher Aspekt seiner Beobachtung ist die Tatsache, dass jeder Spieler seine Strategie spielt, und zwar unter der Voraussetzung, dass die anderen Spieler an ihrer Strategie festhalten. Dann ist der Spieler davon überzeugt, dass seine Strategie zum Erfolg führt. Im Falle der Spieltheorie hat diese Ansicht einen beachtlichen Stellenwert bekommen. Für D. Prelec ist sie der Schlüssel zur Umformulierung seiner Formelwelt.
Dabei ist das "Prinzip des Positiven" auch in der Computerei gängig. Da gibt es die Entdeckungsrate und die Fehlalarmrate. Die Entdeckungsrate trainieren wir, indem wir den richtigen Absender markieren. Die Fehlalarmrate wird zu unserem Ärger immer ausgelöst, wenn die E-Mail im Grunde richtig zugestellt gewesen wäre. Was uns letztendlich bestimmt, ist die Bayesische Entdeckungsrate, nämlich die Rate, die den richtigen Alarm auslöst. Wie sehr die Bayesische Entdeckungsrate von Programm zu Programm verschieden ist, können wir in der Zeitschrift c't nachlesen.
Nach dem letzten Bericht spielt "Thunderbird" von Natur aus eine hervorragende Rolle. Sein Geheimnis ist das Ergebnis der hervorragenden Auswahl, die auch ohne theoretischen Ballast funktioniert. Natürlich wird sie nicht alle Situationen meistern. Dennoch wird viel Spam abgefangen. Der Bericht von D. Prelec ist offensichtlich der erste Versuch, auch in der Spieltheorie komplizierte Wechselwirkungen "verständlich" zu vereinfachen.