Von der Wahrsagerei zur Wahlprognose
Umfragen zu Bundes- und Landtagswahlen liegen oft daneben. Warum ist das so und welche Alternativen gibt es? Ein Vergleich von Umfrageinstituten, Wahlbörsen und Expertenprognosen
Wie nach der letzten Bundestagswahl im September 2021 lĂ€uft es in Deutschland fast immer wieder ab. Vor der Wahl gibt es eine groĂe Anzahl von Umfragen und Voraussagen, die von Medien und Politikern förmlich aufgesogen werden.
Dabei wird wenig ĂŒber deren Genauigkeit und QualitĂ€t diskutiert. Vielmehr möchte man lieber hohe Aufmerksamkeit erregen, weil sich daraus besondere Geschichten schreiben lassen, die beim Publikum besser ankommen als nĂŒchterne, aber viel informativere Statistiken.
Nach der Wahl folgt meist nur ein knappes ResĂŒmee. Je nach PrognosegĂŒte zum Beispiel eine kurze, harte Kritik, wie nach den schlechten Analysen zur Landtagswahl in Sachsen-Anhalt oder Lob wie bei der aktuellen Bundestagswahl, allerdings nur fĂŒr die Umfragen.
Dann verlangt man wieder nach neuen politischen EinschĂ€tzungen, die von speziellen Anbietern wie Civey mit Internetumfragen fast tĂ€glich durchgefĂŒhrt werden, ohne deren QualitĂ€t empirisch nachweisen zu können.
Im Gegensatz dazu soll als Diskussionsgrundlage eine umfangreiche QualitÀtsanalyse mittels einer Gesamttabelle zu den letzten sechs Bundestagswahlen sowie einem zweiten Ranking zu den 16 aktuellen Landtagswahlen vorgelegt werden. Damit ist ein mittel- bis langfristiger, objektiver Vergleich anhand von sechs sinnvollen Kriterien möglich.
Gesamtrangliste zu den Bundestagswahlen 2002-2021
Die Gesamtrangliste zu den Bundestagswahlen beginnt 2002, weil seitdem verstÀrkt Wahlbörsen eingesetzt worden sind. Ferner wird gefordert, dass ein Institut nur dann in diese Rangliste aufgenommen wird, wenn es an mindestens der HÀlfte dieser Bundestagswahlen teilgenommen hat.
Bis zur letzten Wahl waren dies zehn Institute, die alle weiterhin dabei sind. Jetzt kommen sechs neue hinzu, und zwar die drei Umfrageinstitute INSA, Trend Research und Ipsos sowie die drei Expertenprognosen von Prognosys, PollyVote und Prognos.
In der Zusammenstellung zu einer Gesamtrangliste gibt es dadurch einige kleine Harmonisierungsprobleme, weil zum Beispiel insgesamt die letzten Bundestagswahlen 2017 und 2021 hinsichtlich der PrognosegĂŒte recht gut ausgefallen sind, insbesondere im Vergleich zur bisher schlechtesten von 2005.
Bei den vier individuellen Kriterien MAF (mittlerer, absoluter Fehler), MAPF (mittlerer, absoluter, prozentualer Fehler), MQF (mittlerer, quadratischer Fehler) und MFIP95 (mittlerer Fehler fĂŒr Intervall-Prognosen)1 [1] kann man feststellen, dass die Neulinge dadurch einen gewissen Vorteil haben.
Bei den beiden kollektiven Kriterien ist es hingegen anders. Mit den Top drei/Flop drei Bewertungen sollen besonders gute bzw. schlechte Institute in jeder Wahl in Bezug auf alle Teilnehmer einen zusÀtzlichen Bonus bzw. Malus erhalten. Das ist bei den Wahlen 2002 bis 2009 mit insgesamt neun bis elf Teilnehmern leichter möglich als bei den letzten beiden Wahlen mit der Rekordzahl von 24 Instituten.
Noch deutlicher wird dieser Sachverhalt beim Kriterium MR des mittleren Rangs.2 [2] Dort werden nur in Bezug auf die Teilnehmer am Gesamtranking fĂŒr jede Wahl die RĂ€nge ermittelt und der Durchschnitt gebildet. Da es bei den ersten Bundestagswahlen von 2002 bis 2009 deutlich weniger Konkurrenten gab als von 2013 bis 2021, haben hier die Neulinge ebenfalls einen Nachteil.
Bei Betrachtung aller sechs Kriterien kommt es damit zu einem Ausgleich (kurze ErlÀuterungen zu den Kriterien findet man im Anhang). Diese Rangliste, die neben der Gesamtrangliste aus allen aktuellen Landtagswahlen am wichtigsten ist, besitzt daher eine starke Aussagekraft.
| Institut | Methode | Teilnahmen | Rangsumme | Rang |
| Prognosys-Master-Vote | EP | 3 | 15,5 | 1 |
| Prognosys/PESM | WB | 5 | 19,5 | 2 |
| ProKons/Wahlfieber | WB | 5 | 21,0 | 3 |
| FGW | U | 6 | 25,5 | 4 |
| INSA | U | 3 | 29,0 | 5 |
| Allensbach | U | 6 | 42,0 | 6 |
| Trend Research | U | 3 | 45,0 | 7 |
| Ecce Terram/Wahlstreet | WB | 3 | 49,5 | 8 |
| infratest | U | 6 | 51,5 | 9 |
| PollyVote/Uni MĂŒnchen | EP | 3 | 57,5 | 10 |
| Emnid | U | 6 | 60,0 | 11 |
| Forsa | U | 6 | 68,0 | 12 |
| eix/Uni Karlsruhe | WB | 3 | 74,0 | 13 |
| Prognos | EP | 3 | 79,0 | 14 |
| GMS | U | 6 | 83,0 | 15 |
| Ipsos | U | 3 | 96,0 | 16 |
| EP: Expertenprognose; WB: Wahlbörse; U: Umfrage | ||||
Nach den Bundestagswahlen von 2013 und 2017 hatte sich ein stabiles Spitzentrio aus Forschungsgruppe Wahlen (FGW) und den beiden Wahlbörsen von Prognosys und ProKons aus Ăsterreich gebildet. Jetzt hat der Neuling Prognosys-Master-Vote mit drei sehr guten bis guten Prognosen die FĂŒhrungsposition erobert vor der PESM-Wahlbörse, ebenfalls von Prognosys, sowie Wahlfieber von ProKons.
Durch das im Vergleich zur Konkurrenz nicht ganz so gute Abschneiden im Jahr 2021 liegt FGW nun auf dem vierten Platz, vor dem zweiten Neuling, dem Umfrageinstitut INSA.
Hinter diesem Quintet klafft in der Rangsumme und damit der QualitĂ€t eine groĂe LĂŒcke. Im nachfolgenden Mittelfeld sind sechs weitere Institute positioniert. ZunĂ€chst Allensbach, das noch face-to-face-Umfragen durchfĂŒhrt und dieses Mal von allen zwölf teilnehmenden Umfrageinstituten am besten abgeschnitten hat.
Es folgt mit Trend Research ein weiterer Neuling vor Wahlstreet, der Wahlbörse von Ecce Terram, die 1998 in Kooperation mit Die Zeitund einem Rekord von 9.500 Teilnehmern die Wahlbörsen populÀr gemacht hat. Diese verdienstvolle Wahlbörse wird nach der nÀchsten Bundestagswahl wahrscheinlich ausscheiden, weil sie seit 2009 nicht mehr aktiv war.
Auf dem neunten Platz steht infratest. Das Institut könnte in der Spitzengruppe sein, wenn es nicht darauf verzichten wĂŒrde, in der letzten Woche vor der Wahl Umfragen durchzufĂŒhren. Auf dem zehnten Platz steht mit PollyVote von der UniversitĂ€t MĂŒnchen ein sehr interessanter Vertreter, der mit seinem kombinierten Ansatz in den USA groĂe Erfolge errungen hat.
Die Methode enthĂ€lt folgende Komponenten: Umfragen, PrognosemĂ€rkte, eine Expertengruppe sowie Spezialmodelle. In Deutschland scheint die Konkurrenz hĂ€rter zu sein - wie die bisherigen Ergebnisse zeigen. Das Mittelfeld wird von Kantar (frĂŒher Emnid) komplettiert.
Das hintere Drittel fĂŒhrt Forsa an. Dahinter folgt mit eix eine Wahlbörse der UniversitĂ€t Karlsruhe, die ebenfalls bereits lĂ€nger nicht mehr angetreten ist. Die Expertenprognose von Prognos erreicht nur einen enttĂ€uschenden vierzehnten Platz. Bei Landtagswahlen hat sie wesentlich besser abgeschnitten und hĂ€ufig Spitzenresultate erzielt. SchlieĂlich liegen die beiden Umfrageinstitute GMS und Ipsos am Tabellenende.
Beim Methodenvergleich fĂŒhren die drei Spezialprognosen von Prognosys-Master-Vote, PollyVote und Prognos knapp vor der Gruppe der vier Wahlbörsen. Klar auf dem letzten Platz rangiert die Gruppe der neun Umfrageinstitute.
Diese Gesamtrangliste fĂŒr die sechs zurĂŒckliegenden Bundestagswahlen ist sehr aufschlussreich, weil sie ĂŒber einen lĂ€ngeren Zeitraum mithilfe von sechs Kriterien eindeutig die Spreu vom Weizen trennt und die Institute mit besonders guter PrognosequalitĂ€t auszeichnet.
Gesamtrangliste der 16 aktuellen Landtagswahlen
In der Gesamtrangliste fĂŒr sĂ€mtliche aktuellen Landtagswahlen fĂŒhrt wieder FGW mit deutlichem Vorsprung wie bei unserer ersten Analyse Ende 2018. Zwischendurch konnte sich die anonyme Expertenprognose von Prognos nach einer Serie erfolgreicher Prognosen in den Jahren 2019 und 2020 an die Spitze setzen.
Nach den Doppelwahlen in Baden-WĂŒrttemberg und Rheinland-Pfalz im MĂ€rz 2021 erreichte FGW, zunĂ€chst gemeinsam mit der PESM Wahlbörse, und schlieĂlich nach den relativ guten Ergebnissen in Sachsen-Anhalt wieder allein, die Spitzenposition.
| Institut | Methode | Teilnahmen | Rangsumme | Rang |
| FGW | U | 16 | 7,5 | 1 |
| Prognosys-Master-Vote | EP | 16 | 16,0 | 2 |
| Prognosys/PESM | WB | 16 | 18,5 | 3 |
| Wahlfieber | WB | 16 | 21,5 | 4 |
| Prognos | EP | 16 | 26,5 | 5 |
| Birnstingl | EP | 12 | 40,5 | 6 |
| Wahlrecht.de/Wahltipp | EP | 10 | 43,0 | 7 |
| dawum | EP | 12 | 43,5 | 8 |
| infratest | U | 16 | 54,0 | 9 |
| INSA | U | 16 | 62,0 | 10 |
| Civey | U | 13 | 63,0 | 11 |
Zurzeit folgen hinter FGW mit jeweils geringen AbstĂ€nden untereinander der Prog-no-sys-Master-Vote, eine ExpertenschĂ€tzung von Professor Mohr, sowie die beiden Wahlbörsen von PESM und Wahlfieber. Hingegen ist Prognos nach den mĂ€Ăigen Resultaten bei den letzten beiden Wahlen etwas weiter zurĂŒckgefallen. Diese fĂŒnf Institute bilden somit seit mehreren Jahren in wechselnder Reihenfolge eindeutig die Spitzengruppe.
Mit gröĂerem Abstand wird das Mittelfeld von Birnstingl angefĂŒhrt, einer kompetenten und diskussionsfreudigen Wahlbörsenspezialistin aus dem fernen Rom. Dahinter folgt mit dem Wahltipp eine erfolgreiche Version der direkten Schwarmintelligenz. Es sieht leider so aus, dass der Betreiber Wahlrecht dieses interessante Experiment nicht mehr fortsetzen wird.
Neu hinzugekommen ist dawum mit einer gewichteten Durchschnittsprognose von relevanten Wahlumfragen, wobei etwa aktuellere Umfragen höher gewichtet werden. Bemerkenswert ist der Sachverhalt, dass von den hier vertretenen vier Umfrageinstitute nur eines, nÀmlich FGW, besser anschneidet als dawum.
Im Schlussabschnitt der Tabelle sind nur noch Umfrageinstitute zu finden. Deren PrognosequalitĂ€t steht somit in einem krassen MissverhĂ€ltnis zum getĂ€tigten Aufwand. Auf Platz neun rangiert das renommierte und traditionsreiche Institut infratest dimap, das viele Analysen fĂŒr die ARD durchfĂŒhrt. Dieses Institut hĂ€lt als einziges immer noch an der frĂŒher postulierten Selbstverpflichtung fest, in der letzten Woche vor der Wahl keine Umfragen durchzufĂŒhren.
Wenn man nur die Prognosen in der vorletzten Woche vergleicht, könnte infratest durchaus mit dem Spitzenreiter FGW (ZDF) konkurrieren. Da die ARD sich ĂŒber die GebĂŒhren der Rundfunkabgabe finanziert, sollte sie eigentlich verpflichtet sein, mit ihrem Jahresetat von ĂŒber fĂŒnf Milliarden Euro und ihrem sehr hohen Aufwand fĂŒr Wahlanalysen und Prognosen bestmögliche SchĂ€tzungen vorzulegen.
INSA und Civey versuchen ebenfalls mit viel Ăffentlichkeitsdrang und hĂ€ufigen Umfragen im Umfeld von Wahlen fĂŒr Bild (INSA) und Spiegel (Civey) zu punkten.
Insbesondere das relativ neue Institut Civey strebt an, mit seinen massenhaften, fast tÀglichen internetbasierten Umfragen zu Politikerinnen und Politikern, Parteien und anderen allgemein wichtigen Fragen unsere Gesellschaft zu vermessen. Es gibt dazu jedoch kaum reale Vergleichswerte, womit eine hinreichende, empirische QualitÀtskontrolle nicht stattfinden kann. Man darf höchstens annehmen, dass die statistischen Aussagen in der Tendenz stimmen.
Wie INSA schneidet auch Civey im Ranking der finalen Wahlprognosen relativ schlecht ab, indem sie seit lÀngerer Zeit die beiden letzten PlÀtze belegen. Das ist umgekehrt proportional zu ihren AktivitÀten und öffentlichen Auftritten.
Das Institut Forsa ist wegen der geringen Teilnahmen aus der Tabelle gefallen. Es lag vorher ebenfalls auf den hinteren RÀngen. Weitere Traditionsinstitute wie Allensbach, Emnid (Kantar) oder GMS sind praktisch nicht mehr bei Landtagswahlen tÀtig, sondern machen lieber wie Forsa hÀufiger Umfragen zu den Bundestagswahlen, weil diese mehr Publicity bringen.
Auch wenn die Medien es wohl wieder nicht zur Kenntnis nehmen werden, ist als Fazit völlig einwandfrei festzuhalten: Von der Methode her stehen die Wahlbörsen mit groĂem Vorsprung vorn, insbesondere weil sie unter anderem hĂ€ufig, wie bei der aktuellen Bundestagswahl, den last swing in den letzten Tagen aufnehmen können.
Klar auf dem zweiten Platz steht die Gruppe der Experten- und Modellprognosen, die nur fremde Informationen verarbeiten, aber selbst nicht wie Umfragen und Wahlbörsen empirische Daten erzeugen. Weit abgeschlagen landet die Gruppe der Umfrageinstitute auf dem letzten Platz.
Umfrageinstitute sind (mit Ausnahme von FGW bei Umfragen zu Bundestagswahlen) intransparent, weil die Rohdaten aus den Befragungen nicht veröffentlicht werden. Zudem wird mit dem Begriff ReprÀsentativitÀt, der zum Goldstandard hochstilisiert wird, etwas vorgetÀuscht, das in der mathematischen Stichprobentheorie nicht existiert.
Man arbeitet vielmehr mit approximativen Zufallsstichproben, wobei der wichtige Ausschöpfungsgrad (der wohl nur noch zwischen zehn und 15 Prozent liegt), ebenfalls geheim gehalten wird. Man kann doch ohne Imageverlust zugeben, dass man das Rohmaterial durch jahrelang gewonnene Expertise teilweise deutlich verÀndert.
Denn letztlich sollte nur die PrognosequalitĂ€t entscheiden. Trotz dieser EinwĂ€nde beherrschen Umfrageinstitute mit Hilfe der Medien den Meinungs- und Prognosemarkt fĂŒr Wahlanalysen fast vollstĂ€ndig, wie man gerade bei den aktuellen Bundestagswahlen gesehen hat. Doch dort sprechen die Prognosevergleiche noch eindeutiger fĂŒr Wahlbörsen als fĂŒr die Umfrageinstitute.
Bei der Super-Rangliste dient als Kriterium die Rangsumme aus den EinzelrÀngen, die in den beiden Gesamttabellen erreicht wurden. Nur sieben Institute sind gleichzeitig in beiden Gesamttabellen vertreten.
| Institut | Rang BTW | Rang LTW | Rangsumme | Gesamtrang |
| Prognosys-Master-Vote | 1 | 2 | 3 | 1 |
| FGW | 4 | 1 | 5 | 2/3 |
| PESM Wahlbörse | 2 | 3 | 5 | 2/3 |
| Wahlfieber (Wahlbörse) | 3 | 4 | 7 | 4 |
| INSA | 5 | 10 | 15 | 5 |
| infratest | 9 | 9 | 18 | 6 |
| Prognos | 14 | 5 | 19 | 7 |
An der Spitze steht zurzeit die Expertenprognose Prognosys-Master-Vote. Gemeinsam folgen das klar beste Umfrageinstitut Forschungsgruppe Wahlen (ZDF) und die PESM Wahlbörse von Prognosys. Knapp dahinter belegt Wahlfieber, eine österreichische Wahlbörse, den vierten Platz. Die LĂŒcke zu den anderen Instituten ist ziemlich groĂ, was auf einen deutlichen QualitĂ€tsunterschied hinweist.
Im unteren Teil sind die beiden Umfrageinstitute von INSA und infratest sowie die ExpertenschĂ€tzungen von Prognos positioniert. Es hat zehn Jahre gedauert, um unser Produkt Prognosys-Master-Vote an die Spitze zu bringen. Mit diesem Projekt sollte gezeigt werden, dass die Prinzipien von Tetlock (im Buch Superforecasting) und Kahnemann (Schnelles Denken, langsames Denken, sowie Noise) erfolgreich auf die Erstellung von Wahlprognosen ĂŒbertragen werden können.
Nach dem Vorbild von Tetlock in den USA könnte man auch in Deutschland eine Gruppe von Superprognostikern ausbilden, die Voraussagen von höchster QualitĂ€t fĂŒr viele Gesellschaftsbereiche erstellen könnte. Das wĂ€re ein Think-Tank, dessen Leistungen numerisch ĂŒberprĂŒfbar wĂ€ren.
Fazit
Die beiden aktiven Wahlbörsen von Prognosys und ProKons schneiden, wie hier gezeigt, klar besser ab als die Gruppe der Umfrageinstitute. Nur Forschungsgruppe Wahlen kann mithalten und die Expertenprognosen von Prognosys-Master-Vote sowie Prognos (zumindestens bei Landtagswahlen).
Weil die QualitĂ€tswerte in beiden Gesamttabellen sehr stabil sind, wird sich in den nĂ€chsten Jahren nur wenig Ă€ndern. Neue Institute wie INSA, Civey oder Wahlkreisprognose mĂŒssen Lehrgeld zahlen.
Nach diesen Statistiken ist es höchst verwunderlich, dass Wahlbörsen trotz ihrer QualitĂ€t und medialen Eignung praktisch keine Rolle spielen. Keine gröĂere Zeitung oder Fernsehanstalt hat zum Beispiel auf die hervorragenden Ergebnisse der Wahlbörsen bei den letzten beiden Bundestagswahlen hingewiesen.
Vielleicht können wir mit diesem Artikel eine Diskussion anstoĂen? Interessant wĂ€re eine BegrĂŒndung, warum trotz ihrer eindeutig schlechteren QualitĂ€t die Umfrageinstitute zusammen mit den Medien den Meinungs- und Prognosemarkt bei Wahlen vollstĂ€ndig dominieren.
Ăber die Autoren:
Prof. Dr. Walter Mohr
Studium der Mathematik und Wirtschaftswissenschaften, Lehr- und ForschungstĂ€tigkeiten an Fachhochschulen und UniversitĂ€ten mit ĂŒber 50 Veröffentlichungen, insbesondere in den Bereichen Zeitreihenanalyse und Wirtschafts- und Wahlprognosen sowie medizinischen QualitĂ€tsuntersuchungen (eHealth).
Dr. Frank W. PĂŒschel
Studium der Mathematik und Wirtschaftswissenschaften, LehrtĂ€tigkeiten im Hochschulbereich, Forschungsschwerpunkt auf den Gebieten der Zeitreihenanalyse und Wirtschaftsprognosen. Aktuell tĂ€tig in der GeschĂ€ftsfĂŒhrung eines Medizinprodukteherstellers.
ErlÀuterungen zu den Gesamttabellen
MAF: mittlerer, absoluter Fehler
FĂŒr jedes Institut werden die absoluten Abweichungen (das heiĂt ohne Beachtung der Vorzeichen) zwischen Prognose und Wahlergebnis fĂŒr jede Partei aufaddiert und daraus der Mittelwert berechnet. Der MAF ist einfach interpretierbar und wird in den Medien am hĂ€ufigsten verwendet.
MAPF: mittlerer, absoluter, prozentualer Fehler
Die absoluten Abweichungen zwischen Prognose und Wahlergebnis (MAF) werden bei jeder Partei durch die zugehörigen Wahlergebnisse dividiert. Diese Quotienten werden aufaddiert und daraus der Mittelwert berechnet. Der MAPF ist eine sinnvolle ErgÀnzung zum MAF, da er den absoluten Fehler in Relation zum Wahlergebnis betrachtet. Es macht einen deutlichen Unterschied, ob man beispielsweise bei einem Wahlergebnis von 5 Prozent oder von 20 Prozent um absolute 2 Prozentpunkte falsch liegt. Im ersten Falle betrÀgt der prozentuale, absolute Fehler 40 Prozent, im zweiten nur 10 Prozent. Das bedeutet jedoch auch, dass der MAPF sehr sensibel auf eine Abweichung bei einer kleineren Partei reagieren kann.
MQF: mittlerer, quadratischer Fehler
Hier werden die einzelnen absoluten Abweichungen zwischen Prognose und Wahlergebnis fĂŒr jede Partei quadriert. Diese Werte werden aufsummiert und daraus der Mittelwert bestimmt. Bisweilen wird daraus noch die Quadratwurzel gezogen, um den sogenannten root mean square error (RMSE) zu erhalten. Der MQF bzw. RMSE ist ein natĂŒrliches DistanzmaĂ und liefert die Basis fĂŒr statistische Tests.
MFIP95: mittlerer Fehler fĂŒr Intervall-Prognosen
FĂŒr jede Partei und die Sonstigen wird auf Basis der jeweiligen Punktprognose mittels der bei Zufallsstichproben ĂŒblichen Fehlerformel ein 95-prozentiges Prognoseintervall berechnet. Ein Fehler liegt vor, wenn dieses Prognoseintervall den tatsĂ€chlichen Wert nicht ĂŒberdeckt. Gibt es z.B. in 7 FĂ€llen 2 Fehler, so betrĂ€gt der zugehörige MFIP95 hierfĂŒr 2/7=0.286.
Weitere Anmerkungen
Alle vier Fehlerkriterien sind stark positiv korreliert. Bei jedem Fehlerkriterium wird jedem Institut durch Vergleich der Werte mit den anderen Instituten ein entsprechender Rang zugeordnet. Bei Gleichheit von mehreren Instituten in einem Kriterium wird allen der entsprechende mittlere Rang zugewiesen. Alle vier FehlermaĂe werden gleich gewichtet. Aus den einzelnen RĂ€ngen wird die Rangsumme (RS) gebildet, mit deren Hilfe schlieĂlich die endgĂŒltige Rangliste bei Einzelwahlen erstellt wird.
Zu den vier FehlermaĂen werden fĂŒr die Erstellung einer Gesamtrangliste aus mehreren Einzelranglisten noch zwei zusĂ€tzliche Kriterien verwendet, nĂ€mlich der Top3/ Flop3-Anteil sowie der mittlere Rang fĂŒr die jeweilige Gruppe. Beim ersteren werden Platzierungen unter den ersten drei RĂ€ngen aller Teilnehmer positiv und unter den letzten drei PlĂ€tzen negativ bewertet. Diese Differenz zwischen der Anzahl der Top drei- und der Flop drei-PlĂ€tze wird noch durch die Anzahl der Teilnahmen dividiert.
Beim mittleren Rang (MR) werden die RĂ€nge aus den Einzelranglisten gemittelt, allerdings nur bezogen auf die Konkurrenten des Gesamtrankings. Ferner werden nur Institute in die Gesamtrangliste aufgenommen, die an mindestens der HĂ€lfte der Einzelwahlen teilgenommen haben.
FuĂnoten
[3] [1] MAF: mittlerer, absoluter Fehler
FĂŒr jedes Institut werden die absoluten Abweichungen (das heiĂt ohne Beachtung der Vorzeichen) zwischen Prognose und Wahlergebnis fĂŒr jede Partei aufaddiert und daraus der Mittelwert berechnet. Der MAF ist einfach interpretierbar und wird in den Medien am hĂ€ufigsten verwendet.
MAPF: mittlerer, absoluter, prozentualer Fehler
Die absoluten Abweichungen zwischen Prognose und Wahlergebnis (MAF) werden bei jeder Partei durch die zugehörigen Wahlergebnisse dividiert. Diese Quotienten werden aufaddiert und daraus der Mittelwert berechnet. Der MAPF ist eine sinnvolle ErgÀnzung zum MAF, da er den absoluten Fehler in Relation zum Wahlergebnis betrachtet. Es macht einen deutlichen Unterschied, ob man beispielsweise bei einem Wahlergebnis von 5 Prozent oder von 20 Prozent um absolute 2 Prozentpunkte falsch liegt. Im ersten Falle betrÀgt der prozentuale, absolute Fehler 40 Prozent, im zweiten nur 10 Prozent. Das bedeutet jedoch auch, dass der MAPF sehr sensibel auf eine Abweichung bei einer kleineren Partei reagieren kann.
MQF: mittlerer, quadratischer Fehler
Hier werden die einzelnen absoluten Abweichungen zwischen Prognose und Wahlergebnis fĂŒr jede Partei quadriert. Diese Werte werden aufsummiert und daraus der Mittelwert bestimmt. Bisweilen wird daraus noch die Quadratwurzel gezogen, um den sogenannten root mean square error (RMSE) zu erhalten. Der MQF bzw. RMSE ist ein natĂŒrliches DistanzmaĂ und liefert die Basis fĂŒr statistische Tests.
MFIP95: mittlerer Fehler fĂŒr Intervall-Prognosen
FĂŒr jede Partei und die Sonstigen wird auf Basis der jeweiligen Punktprognose mittels der bei Zufallsstichproben ĂŒblichen Fehlerformel ein 95 Prozent-iges Prognoseintervall berechnet. Ein Fehler liegt vor, wenn dieses Prognoseintervall den tatsĂ€chlichen Wert nicht ĂŒberdeckt. Gibt es z.B. in 7 FĂ€llen 2 Fehler, so betrĂ€gt der zugehörige MFIP95 hierfĂŒr 2/7=0.286.
[4] [2] Beim mittleren Rang (MR) werden die RĂ€nge aus den Einzelranglisten gemittelt, allerdings nur bezogen auf die Konkurrenten des Gesamtrankings. Ferner werden nur Institute in die Gesamtrangliste aufgenommen, die an mindestens der HĂ€lfte der Einzelwahlen teilgenommen habe
URL dieses Artikels:
https://www.heise.de/-6289275
Links in diesem Artikel:
[1] #anchor_fussnote_1
[2] #anchor_fussnote_2
[3]
[4]
Copyright © 2021 Heise Medien