Was die "StopptCOVID"-Studie des RKI aussagt – und was nicht

Seite 2: RKI-Studie überprüft die Wirkung der Maßnahmen nicht, sondern setzt sie stillschweigend voraus

Bei dem RKI-Ansatz handelt es sich um eine statistische Studie, die darauf aufbaut, messbare Zusammenhänge zwischen den Maßnahmen und dem Infektionsgeschehen über die Zeit zu finden. Hierbei wird ein übliches statistisches Analyseverfahren – die Regressionsanalyse – verwendet, mit dem der zeitliche Verlauf der Corona-Wellen – gemessen anhand des bekannten "R-Wertes" – zu erklären versucht wird.

Der Modellansatz ist hierbei ein sog. lineares Paneldatenmodell, womit es möglich ist, Zusammenhänge über die Zeit und über mehrere Untersuchungseinheiten hinweg – hier: Bundesländer – zu untersuchen.

Diese Form der statistischen Datenanalyse ist keineswegs "falsch", und man könnte sie auch dafür nutzen, kausale Effekte zu untersuchen, nur leider wurde das in der RKI-Studie nicht getan (siehe oben). Es gibt aber auch in der Formulierung des genutzten Modells mehrere Schwierigkeiten, die, wie wir sehen werden, das Ergebnis der Studie ganz entscheidend beeinflussen.

Um zu verstehen, wie im RKI-Modell auf die Wirkung von Maßnahmen geschlossen werden soll, müssen wir uns zwangsläufig zunächst damit beschäftigen, wie ein Regressionsmodell überhaupt vom Prinzip her funktioniert.

Ein solches Modell zu konstruieren, ist eine anspruchsvolle Aufgabe, die in den einschlägigen Studiengängen, in denen diese Modelle üblicherweise eingesetzt werden, einen großen Raum einnimmt.

Grob gesagt läuft das Verfahren wie folgt: Wir haben eine Variable, die wir "erklären" wollen, also für die wir wissen möchten, wovon sie abhängt. Im RKI-Modell ist das der R-Wert. Die "Erklärung" erfolgt über eine Reihe von unabhängigen Variablen (siehe oben). Dann wird mit einem mathematischen Schätzverfahren – etwa die Methode der kleinsten Quadrate – das Modell an den Verlauf der Echtdaten angepasst.

Für jede erklärende Variable wird also ihre "Wirkung" identifiziert, genauer gesagt: aus den Zusammenhängen in den Daten hergeleitet wird, sie wird also empirisch bestimmt. Das Ergebnis ist hierbei, vereinfacht ausgedrückt, eine "optimale", jedoch niemals eine "perfekte" Anpassung. Weiterhin wird in einer solchen Analyse überprüft, ob die gefundenen Effekte "überzufällig" sind, was man landläufig als statistische Signifikanz bezeichnet.

Es gibt hierbei eine Reihe Gütekriterien, zum Beispiel, was die Auswahl der Variablen in einem solchen Modell angeht. Besonders herausfordernd ist, dass diese Variablenauswahl gleich zwei Voraussetzungen hat, zwischen denen man eine Abwägung treffen muss:

Einerseits müssen alle relevanten Variablen im Modell enthalten sein – sonst besteht eine Verzerrung durch ausgelassene Variablen und das Modell ist nicht mehr "optimal". Man sagt dann auch: Ein solches Modell ist fehlspezifiziert.

Praktisch bedeutet das, dass die Effekte der anderen Variablen über- oder unterschätzt werden. Denn so ein Modell hat noch eine weitere wichtige Eigenschaft: Es lassen sich damit die Auswirkungen einzelner Größen isoliert betrachten, also unter ansonsten gleichen Bedingungen.

Man kann sich das so vorstellen: Der Effekt einer Variable – nennen wir sie X1 – in so einem Modell ergibt nur Sinn in Kombination mit den anderen Variablen im Modell (z.B. X2 und X3). Es wird häufig auch so formuliert: Um den Einfluss von X1 sauber zu bestimmen, müssen wir den Einfluss von X2 und X3 "herauskontrollieren".

Das bedeutet: Wir müssen auch andere Effekte in unserem Modell zulassen, die eine Wirkung haben, auch wenn die uns vielleicht gar nicht interessieren. Andererseits sollten keine Redundanzen auftreten, das bedeutet, dass wir keine Variablen im selben Modell haben dürfen, die (fast) das Gleiche aussagen.

Es wird deutlich, dass so eine Modellbildung keine triviale Aufgabe ist. Um es vorwegzunehmen: Das Modell in der RKI-Studie verstößt gleich gegen beide Voraussetzungen – was einen enormen Einfluss auf die Modellergebnisse hat.

Wir möchten hier aber nur auf den erstgenannten Aspekt zu sprechen kommen, weil dieser wesentlich wichtiger ist.

Schauen wir uns an, woraus das Modell in der RKI-Studie besteht: Das Infektionsgeschehen – gemessen durch den R-Wert – hängt darin ab von

  1. einer saisonalen Schwankung,
  2. den Virusvarianten,
  3. den Corona-Maßnahmen und
  4. der Impfung.

Die saisonale Schwankung ist nicht sonderlich passend modelliert, worauf wir auch in unserem Kommentar eingehen, was uns aber an dieser Stelle nicht weiter kümmern soll. Viel interessanter ist, wenn wir uns anschauen, wie das RKI-Modell bereits konzipiert ist – und was diese Modellspezifikation inhaltlich aussagt: Das Modell ist so aufgebaut, dass von einer Wirkung der Maßnahmen ausgegangen wird. Präziser ausgedrückt: Durch die Wahl der Variablen im Modell ist bereits vorbestimmt, dass Corona-Maßnahmen zwangsläufig einen drosselnden Effekt haben müssen.

Warum? Weil das Modell, schlicht und ergreifend, keine anderen Variablen berücksichtigt, die überhaupt eine Senkung des R-Wertes herbeiführen könnten – außer Corona-Maßnahmen und Impfungen.

Da abgesehen von den wiederkehrenden saisonalen Schwankungen und den Maßnahmen im Modell keine weiteren erklärenden Variablen auftauchen, ist implizit bereits definiert, dass Maßnahmen zur Senkung des R-Wertes beigetragen haben müssen. Um ganz deutlich zu werden:

Wir könnten – anstatt der Maßnahmen – beliebige andere Variablen in das Modell einsetzen, die sich auf irgendwelche Ereignisse beziehen, die beispielsweise im Dezember 2020 oder Januar 2021 stattgefunden haben – wir würden in jedem Fall einen drosselnden Effekt finden.

Dass das Infektionsgeschehen nachweislich auch unabhängig von Maßnahmen über die Zeit an Geschwindigkeit verliert oder Menschen individuell ihr Infektionsrisiko senken – beispielsweise durch Lüften in Innenräumen, Outdoor-Treffen oder Verzicht auf Umarmungen – ist im Modell nicht vorgesehen.

Wir können also sagen: Das Modell ist fehlspezifiziert, weil nicht alles, was den "R-Wert" beeinflusst, dadurch abgebildet wird. Fehleinschätzungen des Einflusses der anderen Variablen sind die logische Folge.

Es kommt hier noch ein anderes Problem hinzu: Der Einfluss der Virusvarianten (hier: "Alpha" und "Delta") ist zwar Teil des Modells, wird aber, anders als bei den anderen Größen, nicht empirisch bestimmt, sondern bereits durch das Modellierungsteam vordefiniert. Ein solches Vorgehen beim Aufbau eines Modells ist, vorsichtig ausgedrückt, unüblich.

Normalerweise wird im Zuge des Schätzverfahrens für alle erklärenden Variablen der Einfluss empirisch ermittelt, und zwar über die Anpassung des Modells an die Echtdaten (siehe oben). Für den Einfluss der Virusvarianten ist das nicht gemacht worden – es wird bereits die Annahme getroffen, dass die späteren Varianten einen deutlich höheren R-Wert haben müssen und dementsprechend wird dieser R-Wert im Modell bereits definiert.

Die Ausprägungen der abhängigen Variablen, die ja eigentlich aus den Daten erklärt werden sollen, werden also zu einem guten Teil festgelegt. Diese (hohen) Werte haben im Modell einen entscheidenden Effekt, denn sie beeinflussen die Ergebnisse der anderen Modellteile: Die a priori-Definition höherer R-Werte für spätere Virusvarianten bedeutet nämlich, dass die "eigentlich zu erwartenden" R-Werte in der zweiten und insbesondere der dritten Welle wesentlich höher gewesen sein müssten als in der ersten Welle.

Da sie das aber nachweislich nicht waren, ergibt sich logischerweise eine Differenz zwischen dem erwarteten und dem tatsächlichen R-Wert. Anders ausgedrückt: Der R-Wert wird im Modell erst "künstlich" höher gemacht, als er es in der Realität war. Dann vergleicht das Modell diesen künstlich erhöhten R-Wert mit dem tatsächlichen R-Wert.

Welche Umstände könnten nun dafür gesorgt haben, dass die R-Werte dann doch nicht so hoch ausgefallen sind wie es angenommen wird? Im Modell gibt es, wie bereits dargelegt, keine anderen Erklärungsvariablen, auf die diese Drosselung zurückzuführen sein könnte – außer Maßnahmen und Impfung.

Die Abweichungen der echten R-Kurve von der angenommenen Modellkurve wird also Maßnahmen und Impfung zuerkannt, da im Modell überhaupt gar keine anderen Gründe hierfür vorgesehen sind.

Die Definition der höheren R-Werte für spätere Varianten steuert also das Modellergebnis mit.