Die Telepolis-Fußball-Weltrangliste

Abb. 1: Zwei mögliche Logit-Funktionen für die Berechnung der Siegwahrscheinlichkeit.

Der Telepolis-Index berücksichtigt die vier existierenden Fußballrankings und platziert die deutsche Mannschaft nach Spanien auf Platz 2

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Jeder kennt Fußball-Rankings, z.B. solche die von der FIFA oder auch von privaten Institutionen bzw. Firmen regelmäßig veröffentlicht werden. Idealerweise sollte ein Ranking die verschiedenen Nationalteams, je nach tatsächlicher Spielstärke, der Reihe nach auflisten. Würden die Nationalteams jedes Jahr ein "Liga-Turnier" bestreiten, würden sie sich automatisch am Ende der Saison einordnen. Das ist jedoch nicht der Fall, da meistens nur regional gespielt wird und Freundschaftsspiele zwischen Teams aus verschiedenen Kontinenten häufig irrelevant sind.

Teil 1 der Serie über wissenschaftliche Aspekte des Fußballspiels: Die Impetustheorie des Fußballs.

Ein Ranking muss man aus vorangegangen Spielen und Querverbindungen zwischen den Teams mathematisch ableiten, so dass zukünftige Spiele so gut wie möglich vorhergesagt werden können. Beim Schach gibt es z.B. die Elo-Rankings, die ein guter Indikator der individuellen Spielstärke der Schachspieler sind. Beim Fußball hätte man gerne etwas Ähnliches, denn, wie ein schöner Spruch heißt: "Fußball ist wie Schach - nur ohne Würfel."

Wenn eine Auflistung der Teams nach ihrer Spielstärke gegeben ist, möchte man aus der Differenz der Spielstärken die Siegwahrscheinlichkeit der zwei antretenden Mannschaften berechnen. Abb. 1 zeigt den naheliegenden Gedanken: Ist Team Eins (mit Spielstärke A) viel besser als Team Zwei (Spielstärke B), d.h., ist die Differenz (A-B) der Spielstärken positiv und sehr groß, so steigt die Siegwahrscheinlichkeit von Teams Eins graduell gegen 100%. Ist die Differenz negativ, fällt die Siegwahrscheinlichkeit von Team Eins gegen Null. Bei gleichstarken Teams gewinnt jedes davon nur 50% der Zeit.

Man kann auch die obere Kurve in Abb. 1 glätten, wenn man statt einer linearen Interpolation eine Sigmoide verwendet (die Formel dafür ist in der Abbildung angegeben). Diese Kurve ist symmetrisch um die vertikale Achse, da keine Präferenz für Team Eins oder Zwei vorliegt, und sie schneidet die Achse bei einer Siegquote von 50%. Die Konstante "k" in der Formel dient nur dazu, die Steilheit der Funktion einzustellen. Die Basis der Exponentialfunktion (z.B. die Eulersche Zahl e oder die Zahl 10) ist für die Berechnung unerheblich, da der Effekt der Basis in der Konstanten "k" aufgefangen werden kann.

Bei sehr kleinen Rankingdifferenzen kann man ein Unentschieden voraussagen. Dann bleibt nur die Frage, wie breit die Region für ein Unentschieden sein soll. Das kann man aus echten Daten durch eine Kurvenanpassung feststellen (etwa 23% der Fußballspiele enden unentschieden). Ist kein Patt möglich (wie bei einem Pokalspiel), dann spart man sich die Vorhersage-Region für Unentschieden.

Folgende Fußballrankings genießen heute eine gewisse Popularität:

  • Die FIFA-Rankings, die laufend aktualisiert werden.
  • Die Fußball-Elo-Rankings, die von der Elo-Zahl im Schach inspiriert wurden.
  • Der "Soccer Power Index" (SPI) vom Sportsender ESPN. SPI wurde vom renommierten Statistiker und Vorhersagespezialisten Nate Silver entwickelt.
  • Der Soccernomic-Index, der auf den Marktwert einer Mannschaft, gewichtet mit anderen Indikatoren, zurückgreift.

Auf Basis all dieser Rankings sind Vorhersagesysteme erstellt worden. Man findet bereits Vorhersagen der Weltmeisterschaft 2014 im Internet, die anhand der jeweiligen Indikatoren berechnet wurden.

Die Elo-Zahl

Schach ist sicherlich deterministischer als Fußball und die Erstellung von Weltrankings hat in dieser Disziplin eine lange Tradition. Die Elo-Zahl wurde in den fünfziger Jahren von Arpad Elo vorgeschlagen, um Schachspieler bei Turnieren einordnen zu können. Die Elo-Zahl wird verwendet um einen Sieg vorherzusagen, nach der Formel:

D.h. die Basis für die Exponentialfunktion ist 10 und die Differenz der Elo-Zahlen von beiden Spielern wird durch 400 geteilt. Beträgt die Differenz mehr als 400, in absolutem Wert, wird die Differenz bei 400 abgeschnitten.

Wenn zwei Spieler mit Elo-Zahlen B=1200 bzw. A=1600 gegeneinander antreten, beträgt die Siegwahrscheinlichkeit des stärkeren Spielers 1/1,1. Der bessere Spieler sollte also im Durchschnitt 91% der Zeit gewinnen. Der schlechtere Spieler sollte sich nur 9% der Zeit durchsetzen können.

Wichtig bei der Elo-Zahl ist die zeitliche Anpassung der jeweiligen Spielstärken. Wer Spiele verliert, vergibt Elo-Punkte an den Gewinner. Der Verlust von Elo-Punkten ist größer, je weiter unten der Gewinner im Ranking steht. Wenn p die vorher berechnete Gewinnwahrscheinlichkeit des Gewinners ist, fließt eine Anzahl von Punkten proportional zu (1-p) an ihn, und der Verlierer vergibt eine Anzahl von Punkten proportional zu p. D.h. die Elo-Zahl wird laufend aktualisiert, nach jeder Partie, und die Schachspieler teilen sich die vorhandenen Elo-Punkte je nach Spielstärke.

Abb. 2: Erwartete Gewinnkurve je nach Elo-Rating-Unterschied verglichen mit den beobachteten Gewinnhäufigkeiten bei 8329 Schachspielen (M. Glickman, "A Comprehensive Guide to Chess Ratings").

Wie gut funktionieren das Elo-System und die Umverteilung von Elo-Punkten unter den Spielern nach Sieg und Niederlage? Abb. 2 zeigt das Ergebnis von vielen Schachturnieren. Die theoretische Kurve für die Elo-Zahl-Differenzen ist aufgetragen und, als Punkte dazu, die echten relativen Gewinnhäufigkeiten für die jeweiligen Elo-Differenzen. Wie man sieht, liegt die theoretische Kurve über den empirischen Resultaten, d.h. die Elo-Zahl überschätzt die Gewinnwahrscheinlichkeit des besseren Spielers.

Es ist berechnet worden, dass die Anpassung der empirischen Daten an die theoretische Kurve viel besser wäre, wenn man den Faktor 400 durch 475 in der Elo-Formel für die Gewinnwahrscheinlichkeit ersetzen würde. Es hat sogar mehrere Turniere für Rankingverfahren gegeben, bei denen untersucht wurde, welche Rankingmethodik die besseren Vorhersagen erzeugt, und es existieren Alternativen für die Elo-Zahl (wie das System Elo++). Da aber das Elo-System breite Akzeptanz genießt, ist es sehr schwer, etwas Neues durchzusetzen.

Die FIFA- und Elo-Rankings

Die FIFA-Rankings zu verstehen, erfordert schon viel Geduld, da in diese nicht nur die Ergebnisse von Spielen einfließen, sondern auch die Art des Spiels (Freundschafts-, Turnierspiel, usw.), die geographische Lage (d.h. die Konföderation), die Wichtigkeit des Turniers usw. Je nach Ergebnis vergibt die FIFA Punkte an die Mannschaften und es entsteht somit ein absolutes Ranking.

Die seit einigen Jahren verwendeten Elo-Rankings für Fußball folgen der Philosophie der Schach-Rankings, wobei bei der Berechnung der Punkte, die zwischen Verlierer und Gewinner auszutauschen sind, ein Gewichtungsfaktor für die Art von Turnier und für die Tordifferenz verwendet wird. Bei Unentschieden verliert die stärkere Mannschaft Punkte, die die schwächere Mannschaft gewinnt.

Nun: wie ähnlich sind die FIFA und Elo-Rankings? Für die ersten 30 Teams im FIFA-Ranking ist die Korrelation zwischen FIFA und Elo-Ranking etwa 83%, was etwas überraschend ist. Die beiden Rankings sind also letztendlich nicht so unterschiedlich.

Abb. 3: Korrelation zwischen FIFA- und Elo-Rankings. Der Korrelationsindex beträgt 83%. Daten: März 2014.

Der Ausreißer ist allerdings Brasilien. Bei den FIFA-Rankings ist Brasilien nur Neunter, mit 1104 FIFA-Punkten, während bei der Elo-Berechnung Brasilien, mit Elo-Zahl 2086 führt. Das hat natürlich schwerwiegende Konsequenzen für die Vorhersage der WM 2014, da Brasilien der Gastgeber ist. Statistisch gesehen hat eine Heimmannschaft fast ein halbes Tor "Bonus". Die Vorhersagen anhand von FIFA- bzw. Elo-Punkten können dann sehr unterschiedlich ausfallen.

Der Soccer Power Index

Sehr interessant finde ich den Soccer-Power-Index (SPI) des amerikanischen Senders ESPN. Der Sender ließ sich die Erstellung des Index etwas kosten und engagierte den "Star-Statistiker" Nate Silver dafür. Silver gewann zusätzlich an Beliebtheit, nachdem er für die letzten Präsidentschaftswahlen in den USA den Gewinner in jedem Staat richtig prognostizierte. Silver hatte seine Karriere eigentlich mit Sportvorhersagen gestartet, ging dann zur Politik über, hat aber mit SPI wieder ein Vorhersagesystem für den Sport ersonnen.

Die Mechanik von SPI ist viel komplexer als die von FIFA- und Elo-Rankings. Siege bzw. Niederlagen werden je nach Turnierstärke gewichtet. Wie bei Elo-Rankings spielt die Tordifferenz eine Rolle. Beim SPI werden allerdings die individuellen Spieler betrachtet und deren "Fitness" und Beitrag zum Sieg schlagen sich in einer Einschätzung der Stärke des Angriffs und der Verteidigung nieder. Am Ende erhält man für jedes Team eine Vorhersage, und zwar wie viele Tore pro Spiel gegen eine Mannschaft aus der Tabellenmitte erzielbar wären, und wie viele Tore die Verteidigung zulassen würde.

Im Computer wird ein Turnier zwischen den Teams ausgetragen und am Ende wird ermittelt, welchen Prozentsatz der zu vergebenden Punkte (3 für einen Sieg, 1 für Unentscheiden) diese Mannschaft insgesamt und am Ende des Turniers erhalten würde. Brasilien z.B. hat eine SPI-Zahl von 91,6. In der Bundesliga beispielsweise kann ein Team während einer Saison maximal 102 Punkte ergattern. Brasilien würde (mit dieser Kennzahl und 34 Spielen) 93,4 Punkte bekommen. Die Bayern hatten in dieser Saison (bis März) 94,6% der zu vergebenden Punkte gewonnen. Sie spielten bis dahin überbrasilianisch.

Deutschland belegt beim SPI-Ranking den vierten Platz nach Brasilien, Spanien und Argentinien. Interessanter sind aber die erwarteten Tore und die Stärken des Angriffs bzw. der Verteidigung. Während Deutschland beim Angriff lediglich hinter Brasilien steht, hinkt es bei der Verteidigung, wo Deutschland nur Mittelmaß ist. Es fallen einfach zu viele Tore, sehr zum Verdruss von Herrn Löw, und der Angriff muss es dann ausbügeln. Abb. 4 zeigt die Verteilung der Mannschaften bei der WM 2014 je nach Stärke des Angriffs und der Verteidigung.

Abb. 4: Die vertikale Achse zeigt wie viele Tore eine Mannschaft gegen eine Durchschnittsmannschaft erlauben wurde (Stärke der Verteidigung). Die horizontale Achse zeigt wie viele Tore der Angriff gegen eine Durchschnittsmannschaft schießen sollte (Stärke des Angriffs). Die Daten beziehen sich auf den SPI-Index von März 2014.