zurück zum Artikel

Was uns die Covid-19-Daten sagen – und was nicht

Warum die Datengrundlage zur Beurteilung des Pandemiegeschehens unzureichend ist und wie das Problem gelöst werden kann

Seit mehr als einem Jahr begleitet uns Covid-19. Um unsere Gesundheit zu schützen werden politische Maßnahmen durchgesetzt. Diese Maßnahmen werden dabei hauptsächlich auf die gemeldeten Fallzahlen gestützt, unter anderem durch Berechnung einer Sieben-Tage-Inzidenz. Doch eignen sich die gemeldeten Fallzahlen zur korrekten Lagebeurteilung?

Dieser Artikel beleuchtet, welche Probleme die offiziell gemeldeten Fallzahlen mit sich bringen und wie das Problem gelöst werden kann. Die Grafiken stammen aus dem interaktiven Covid-19-Monitor Germany [1], der Zahlen des Robert-Koch-Instituts und des Divi-Intensivregisters darstellt.

Täglich gemeldete Fallzahlen

Jeden Tag werden die aktuellen Fall- und Todeszahlen zu Covid-19 vom Robert-Koch-Institut (RKI) veröffentlicht. Allerdings melden einige Gesundheitsämter am Wochenende keine Zahlen an das RKI. Außerdem werden am Wochenende weniger Tests durchgeführt, die dann unter der Woche nachgeholt werden. Dies führt zu starken Schwankungen in den gemeldeten Fallzahlen. Die Folge ist, dass Vergleiche zwischen den Tagen nicht aussagekräftig und Trends kaum zu erkennen sind.

Gelöst werden kann dieses Problem, indem man den Kurvenverlauf durch einen gleitenden Sieben-Tage-Mittelwert glättet (vgl. Abb. 1). Dadurch wird bei jedem Tag jeder Wochentag mit berücksichtigt und so die täglichen Schwankungen eliminiert.

Der Fokus darf daher nicht auf den täglich neu gemeldeten Fallzahlen liegen. Besser ist es, den gleitenden Sieben-Tage-Mittelwert und die Veränderung des gleitenden Sieben-Tage-Mittelwerts zum Vortag zu berichten. So ist – im Gegensatz zum Vergleich der gemeldeten Fallzahl zum Vortag – ein Trend erkennbar.

Abb. 1: zeitlicher Verlauf der täglich neu gemeldeten Fallzahlen

Wie anhand des Mittelwerts erkennbar ist, gab es Ende Dezember einen starken Abfall in den Fallzahlen, gefolgt von einem kurzfristigen und starken Anstieg, um dann wieder weiter zu fallen. Gab es eine solche Schwankung tatsächlich?

Vielmehr war es so, dass in diese Zeit die Weihnachtsfeiertage und Neujahr fielen. Das RKI vermeldet täglich die Fallzahlen, die dem RKI wiederum durch die Gesundheitsämter gemeldet wurden. Es scheint so zu sein, dass einige Gesundheitsämter über die Feiertage keine Fallzahlen gemeldet und dies dann Anfang Januar nachgeholt haben. Kann man das in den Daten erkennen?

Erkrankungsbeginn

Hierzu kann man sich den sogenannten Nowcast des RKI anschauen (vgl. Abb. 2). Hierbei handelt es sich um eine Berechnung des RKI, in der versucht wird, die Fälle pro Tag nach Erkrankungsbeginn zu berechnen. Es wird der Erkrankungsbeginn herangezogen, wenn dieser bekannt ist. Ist er nicht bekannt, wird er anhand des Meldedatums approximiert. Das Meldedatum ist das Datum, an dem der Fall den jeweiligen Gesundheitsämtern bekannt geworden ist.

Abb. 2: Nowcast - Approximation der Fallzahlen nach Erkrankungsbeginn

Auch beim Nowcast erkennt man noch Schwankungen in den berechneten Fallzahlen nach Erkrankungsbeginn. Doch woran liegt das? Das RKI berechnet den Erkrankungsbeginn bei den Fällen mit unbekanntem Erkrankungsbeginn durch eine multiple Imputation. Als wichtigster Parameter wird dabei das Meldedatum herangezogen, also gerade das Datum, zu dem ein Fall den Gesundheitsämtern bekannt wurde.

Schaut man sich die lokalen Hochpunkte an, treten diese mit einem Abstand von sieben Tagen auf. Dort schlägt also wieder das Wochenendphänomen zu. Berechnet man nun auch hierfür einen gleitenden Sieben-Tage-Mittelwert für die berechneten Fallzahlen nach Erkrankungsbeginn, kann auch hier der Effekt eliminiert und die Kurve geglättet werden (vgl. Abb. 3).

Abb. 3: Nowcast mittels 7-Tage-Mittelwert geglättet

Schaut man sich nun den Verlauf dieser Kurve an, sieht man, dass der starke Abfall in den Fallzahlen mit anschließendem kurzen, aber steilen Anstieg nicht mehr so gegeben ist. Eine leichte Delle ist dort weiterhin erkennbar. Hält man sich aber vor Augen, dass der wichtigste Parameter zur Berechnung des unbekannten Erkrankungsbeginns das Meldedatum ist und gerade in der Zeit augenscheinlich einige Gesundheitsämter keine Zahlen an das RKI gemeldet haben, kann diese leichte Delle dem Meldeverhalten über die Weihnachtszeit geschuldet sein. Wie später aber auch noch zu sehen ist, gab es in dieser Zeit auch weniger Tests, sodass die Delle auch von einer reduzierten Testzahl herrühren kann.

Beim Blick auf die Nowcast-Zahlen fällt außerdem auf, dass die Schwankungen in den Fallzahlen nach Erkrankungsbeginn in der zweiten Welle stärker gegeben sind, als in der ersten Welle. Hierzu kann man sich den Verlauf der gemeldeten Fallzahlen ansehen, wobei unterschieden wird nach Fällen, zu denen der Erkrankungsbeginn bekannt ist und Fällen, bei denen nur das Meldedatum bekannt ist.

Abb. 4: gemeldete Fälle nach Erkrankungsbeginn (dunkelblau), alternativ nach Meldedatum (hellblau)

In der ersten Welle war bei einem deutlich höheren Teil der Fälle der Erkrankungsbeginn bekannt, als es in der zweiten Welle der Fall war (vgl. Abb. 4). Bis zum 31.07.2020 gab es 148.572 Fälle mit bekanntem Erkrankungsbeginn und 63.736 Fälle ohne bekannten Erkrankungsbeginn. Somit war bei ziemlich genau 70 Prozent der gemeldeten Fälle der Erkrankungsbeginn bekannt.

Anders sieht es zur zweiten Welle aus. Dort liegt das Verhältnis von Fällen mit bekanntem Erkrankungsbeginn und unbekanntem Erkrankungsbeginn bei 1.139.027 zu 1.113.448, womit in der zweiten Welle bei rund 50,7 Prozent der gemeldeten Fälle der Erkrankungsbeginn bekannt war. Das kann mit dem veränderten Testverhalten erklärt werden.

Zu Beginn der Pandemie wurden die Testkapazitäten stark ausgebaut. So gab es bis einschließlich der 10. Kalenderwoche 2020 zusammen 69.184 durchgeführte PCR-Tests. Allein in der 11. Kalenderwoche waren es dann bereits 128.008 und in der 12. Kalenderwoche sogar 374.534 durchgeführte PCR-Tests. Die Anzahl der PCR-Tests blieb dann eine Weile recht stabil. Während der Sommer- und Herbstzeit wurde die Anzahl der Tests dann weiter ausgebaut.

Abb. 5: Anzahl durchgeführter PCR-Tests pro Woche

In der Woche vor Ostern fiel die Zahl der durchgeführten Tests im Vergleich zur Vorwoche. Ob die Zahl der durchgeführten Tests bis einschließlich Gründonnerstag stabil blieb und erst ab Karfreitag aufgrund der Feiertage sank, oder bereits vorher, ist aus den Daten nicht ersichtlich.

Das Testverhalten hat sich über die Zeit immer wieder geändert. Zu Beginn sollten ausschließlich Personen getestet werden, die Symptome aufweisen und zusätzlich Kontakt zu einem nachgewiesenen Covid-19-Fall hatten oder aus einem der damals wenigen Risikogebiete zurückkamen. Anschließend wurden auch Personen getestet, die nur Symptome aufwiesen.

Im Sommer wurden dann auch junge, nicht symptomatische Reiserückkehrer getestet. Das führte dazu, dass einerseits das Dunkelfeld aufgehellt wurde, gleichzeitig führte das aber eben dazu, dass mehr asymptomatische Fälle hinzukamen, bei denen der Erkrankungsbeginn nicht bekannt ist.

Abb. 6: gemeldete Todesfälle nach Erkrankungsbeginn (rot), alternativ nach Meldedatum des Falls (orange)

Bei den gemeldeten Todesfällen ist der Effekt von erster zu zweiter Welle noch ausgeprägter (vgl. Abb. 6). Bei Todesfällen gab es bis zum 31.07.2020 6.879 Todesfälle mit bekanntem Erkrankungsbeginn und 2.529 mit unbekanntem Erkrankungsbeginn. Damit war in der ersten Welle bei rund 73,1 Prozent der gemeldeten Todesfälle der Erkrankungsbeginn bekannt.

In der Zeit vom 01.08.2020 bis 28.02.2021 war bei 27.226 gemeldeten Todesfällen der Erkrankungsbeginn bekannt, jedoch bei 37.982 nicht, was zu einer Quote von rund 41,8 Prozent führt. Während es für die gemeldeten Fallzahlen noch leicht nachzuvollziehen ist, dass der Anteil an Fällen mit bekanntem Erkrankungsbeginn aufgrund der veränderten Teststrategie gefallen ist, so ist das für die gemeldeten Fallzahlen aus den Zahlen nicht herleitbar.

Eigentlich sollten an Covid-19 verstorbene Personen vor ihrem Ableben Symptome aufgewiesen haben, wodurch der Erkrankungsbeginn bekannt wäre. Die Frage, weshalb gerade bei den gemeldeten Todesfällen der Anteil vom bekannten Erkrankungsbeginn von rund 73,1 Prozent auf 41,8 Prozent stärker gefallen ist, als bei den gemeldeten Fällen, bleibt mit den vorliegenden Daten unbeantwortet. Seit Beginn der Pandemie ist lediglich bei rund 45,7 Prozent der gemeldeten Todesfälle der Erkrankungsbeginn bekannt.

Infektionsbeginn

Noch einmal kurz zurück zum Nowcast des RKI. Wie zuvor geschildert, werden beim Nowcast die Fallzahlen nach Erkrankungsbeginn approximiert. Der Infektionsbeginn liegt dabei weiter in der Vergangenheit. Um nun also das Infektionsgeschehen im zeitlichen Verlauf visualisieren zu können, muss noch die Inkubationszeit von fünf bis sechs Tagen [2] abgezogen werden, um auf vereinfachte Weise die Fallzahlen nach Infektionsbeginn zu erhalten.

Abb. 7: Vergleich der gemeldeten Fälle nach Meldung durch das RKI (blau) mit gemeldeten Fällen nach Erkrankungsbeginn ("Nowcast", türkis) und mit gemeldeten Fällen nach Infektionsbeginn (orange)

In der Abbildung wurde der Verlauf der Nowcast-Kurve um fünf Tage nach vorne verlegt, um so den Infektionsverlauf darstellen zu können (vgl. Abb. 7). Bedacht werden muss dabei wieder die Berechnung des Erkrankungsbeginns.

Wie zuvor erläutert, ist für die Berechnung des Erkrankungsbeginns der Fälle mit unbekanntem Erkrankungsbeginn das Meldedatum der wichtigste Parameter. Zwar kann es vorkommen, dass er durch frühzeitige Feststellung erst nach dem Meldedatum liegt. Im Normalfall dürfte der Erkrankungsbeginn jedoch vor dem Meldedatum liegen.

Da gerade in der zweiten Welle bei einem Großteil der Fälle der Erkrankungsbeginn nicht bekannt ist, ist davon auszugehen, dass der Verlauf der Fälle nach Erkrankungsbeginn ein paar Tage früher zu verorten ist, als es der Verlauf der Nowcast-Kurve zeigt. Dementsprechend würde sich auch der Verlauf der Kurve nach Infektionsbeginn etwas in die Vergangenheit verschieben, weshalb die Verschiebung der Nowcast-Kurve zur Visualisierung des Infektionsgeschehens um fünf Tage eher vorsichtig gewählt ist.

Zeitliche Vergleichbarkeit der Fallzahlen

Die veränderte Teststrategie mit der deutlichen Aufstockung der Testkapazitäten hat zur Folge, dass die zeitliche Vergleichbarkeit kaum möglich ist. Wenn die Testkapazitäten zu Beginn massiv ausgebaut werden und nur symptomatische Personen mit einem weiteren Risikomerkmal getestet werden, später aber auch viele asymptomatische Personen, führt das zu einer veränderten Vortestwahrscheinlichkeit. Die Vortestwahrscheinlichkeit besagt, wie wahrscheinlich ein Test positiv ausfällt, bevor der Test durchgeführt wurde.

Wenn man Symptome aufweist und zusätzlich Kontakt zu einer nachweislich infizierten Person hatte, ist eine höhere Vortestwahrscheinlichkeit gegeben, als wenn man ohne Symptome und ohne Risikobegegnung einen PCR-Test durchführt. Ohne Frage ein Vorteil, weil dadurch das Dunkelfeld aufgehellt wird. Es bringt aber eben den Nachteil der fehlenden Vergleichbarkeit mit sich. Das führt im Übrigen auch dazu, dass ein Vergleich der Sieben-Tage-Inzidenz über die Zeit nicht möglich ist, worauf später noch eingegangen wird (siehe Abschnitt "Sieben-Tage-Inzidenz").

Seit Anfang März 2021 steigen die gemeldeten Fallzahlen wieder. Selbstverständlich kann das daran liegen, dass eine dritte Welle auf uns zurollt. Aber kann es auch einen anderen Grund dafür geben? Was hat sich seit Anfang März im Gegensatz zurzeit davor geändert?

Seit dieser Zeit werden massiv Tests mittels Schnelltests durchgeführt. Jeder kann nun in Discountern und Drogeriemärkten Schnelltests kaufen und sich selbst testen. Dass davon auch reichlich Gebrauch gemacht wurde, kann den in kürzester Zeit berichteten Ausverkäufen der Schnelltests abgelesen werden.

Zusätzlich gibt es mittlerweile immer mehr Testzentren, in denen man sich kostenlos mittels Schnelltest testen lassen kann. Auch in Schulen und Kindergärten werden Lehrer und Erzieher nun standardmäßig regelmäßig getestet - bei uns zweimal die Woche - und auch die Schul- und Kitakinder können regelmäßig getestet werden. Auch das führt selbstverständlich zu einer Aufhellung des Dunkelfeldes. Aber es führt auch zu einer fehlenden Vergleichbarkeit der Fallzahlen.

Nun werden in regelmäßigen Abständen symptomlose Personen getestet. Fällt ein Schnelltest positiv aus, wird dieser Schnelltest mittels eines PCR-Test verifiziert oder auch falsifiziert. Eine Person, bei der ein PCR-Test durchgeführt wird, bei der zuvor ein Schnelltest positiv ausgefallen ist, besitzt jedoch eine deutlich höhere Vortestwahrscheinlichkeit. Durch den positiven Schnelltest ist es sehr wahrscheinlich, dass auch der PCR-Test positiv ausfallen wird.

Man könnte zunächst davon ausgehen, dass man anhand des Positivenanteils bei den durchgeführten PCR-Tests ablesen kann, ob mehr Menschen infiziert sind als eine Woche zuvor. Da aber mehr der durchgeführten PCR-Tests mit Personen durchgeführt werden, bei denen zuvor auch ein Schnelltest positiv war, steigt auch die zu erwartende Vortestwahrscheinlichkeit.

Der Positivenanteil kann ebenfalls steigen, ohne dass sich an der Lage etwas geändert hat. Natürlich kann sich tatsächlich die Lage geändert haben und es können mehr Personen infiziert sein. Aus den gemeldeten Fallzahlen kann es aber nicht verlässlich abgelesen werden. Eine Statistik, wie viele Schnelltests durchgeführt wurden, existiert dabei nicht.

Veränderte Altersstruktur bei positiv Getesteten

Es wurde berichtet, dass die Fallzahlen gerade bei den Jüngeren gestiegen sind. Das ist auch nicht verwunderlich. Wenn nun regelmäßig die junge Bevölkerung – Lehrer, Kita-Personal, Schüler und Kitakinder – anlasslos, weil symptomlos, getestet werden, und gerade junge Personen häufig asymptomatisch infiziert sind, werden nun gerade junge Menschen als infiziert gemeldet, die ohne diese Schnelltests nicht festgestellt worden wären.

Damit steigen automatisch gerade die Fallzahlen der jüngeren Bevölkerung an. Auch durch Schulöffnungen kann diese Beobachtung aufgetreten sein. Mit den vorliegenden Zahlen kann dies aufgrund des geänderten Testverhaltens jedoch nicht verlässlich gezeigt werden. Hierzu bedarf es einer anderen Untersuchungsmethode.

Eine Möglichkeit zur Ausweitung der Teststrategie sieht vor, dass jeder Arbeitgeber seinen Angestellten Schnelltests zur Verfügung stellen soll. Der Gedanke dahinter, das Dunkelfeld aufzuhellen, ist nachvollziehbar. Man darf dann aber nicht den Fehler machen, sich zu erschrecken, weil die Fallzahlen steigen. Das ist normal, wenn das Dunkelfeld aufgehellt wird. Es heißt aber nicht, dass sich etwas an der Lage geändert haben muss. Wie nun unter der gegebenen Situation dennoch verlässlich die aktuelle Lage eingeschätzt werden kann, werde ich im weiteren Verlauf noch darlegen.

Sieben-Tage-Inzidenz

Die Berechnung der Sieben-Tage-Inzidenz des RKI erfolgt anhand der gemeldeten Fallzahlen nach Meldedatum. Zwar ist die Zahl in Relation zu 100.000 Einwohner gesetzt. Dennoch hängt der Verlauf des Sieben-Tage-Inzidenzwertes von den absolut gemeldeten Fallzahlen ab. Wie zuvor gezeigt, führt aber eine veränderte Teststrategie mit mehr Tests und einer Aufhellung des Dunkelfeldes auch zu mehr erkannten Fällen, ohne, dass sich die Lage anders darstellen muss.

Das führt dann eben zu einer Erhöhung des Sieben-Tage-Inzidenz-Wertes. Eine Vergleichbarkeit der Sieben-Tage-Inzidenz-Werte aus der ersten Welle, währenddessen fast nur symptomatische Personen getestet wurden mit der zweiten Welle, bei der auch viele asymptomatische Personen getestet wurden oder gar mit der dritten Welle, bei der nun auch viele Personen getestet werden, die zuvor einen positiven Schnelltest aufweisen, ist daher nicht möglich.

Abb. 8: die durch das RKI am 04.04.2021 gemeldeten Fälle nach Datum, wann diese Fälle den jeweiligen Gesundheitsämtern bekannt wurden ("Meldedatum")

Im Übrigen halte ich auch die Berechnung der Sieben-Tage-Inzidenz, unabhängig von den zuvor genannten Problemen, anhand des Meldedatums für problematisch. Diesmal aber, weil dies zu einer etwas zu niedrigen Sieben-Tage-Inzidenz führt. Von den am 04.04.2021 gemeldeten 12.196 Fällen hatten nur 7.017 Fälle das Meldedatum 03.04.2021, die anderen Fälle hatten ein Meldedatum, was weiter in der Vergangenheit lag. Je weiter das Meldedatum für die neu gemeldeten Fälle in der Vergangenheit liegt, desto geringer wird der Anteil an den neu gemeldeten Fällen.

Das führt dazu, dass die Zahl von Fällen vor sieben Tagen recht stabil ist, weil kaum noch mit Nachmeldungen zu rechnen ist. Für den letzten Tag jedoch ist in den nachfolgenden Tagen noch mit vielen Nachmeldungen zu rechnen. Die so berechnete Sieben-Tage-Inzidenz ist daher etwas zu niedrig. Besser ist es daher, die Sieben-Tage-Inzidenz anhand des gleitenden Sieben-Tage-Mittelwerts zu berechnen. Zwar bleiben weiterhin die Probleme vorhanden, dass eine Vergleichbarkeit aufgrund der genannten Gegebenheiten bei der Sieben-Tage-Inzidenz nicht möglich ist. Andere Daten liegen jedoch zurzeit nicht vor, sodass dies aktuell die sauberste Möglichkeit ist.

Es gibt aber noch weitere Probleme mit der Sieben-Tage-Inzidenz. Die gesetzten Grenzwerte für die Sieben-Tage-Inzidenz von 50, respektive 35, wurden während der ersten Welle definiert. Damals wurden weniger Personen getestet, die auch eine andere Vortestwahrscheinlichkeit aufwiesen, da sie zumeist symptomatisch waren und ein weiteres Risikomerkmal besaßen, wie den Kontakt zu einer nachweislich infizierten Person.

Mit dem Aufbau der Testkapazitäten und der Aufhellung des Dunkelfeldes bedeutet eine höhere Sieben-Tage-Inzidenz nicht automatisch, dass wir während der zweiten oder dritten Welle eine andere Situation haben, als während der ersten Welle. Mit einem Wert von 50 hätten wir jetzt aber eine weniger dramatische Situation, als mit einem Wert von 50 während der ersten Welle.

Basisreproduktionszahl R0

Laut RKI gibt die Basisreproduktionszahl R0 an, "wie viele Personen von einer infizierten Person durchschnittlich angesteckt werden, vorausgesetzt, dass in der Bevölkerung keine Immunität besteht und keine infektionspräventiven Maßnahmen ergriffen wurden." Er wird somit zu Beginn einer Pandemie ermittelt. Dem R0-Wert fällt eine große Bedeutung zu, denn laut RKI leiten sich aus einem hohen R0-Wert infektionspräventive Maßnahmen ab. Das RKI gibt den R0-Wert [3] mit einem Wert von 2,8 - 3,8 an. Laut anderen Untersuchungen wird der R0-Wert auch mit Werten von 1,91 [4], 2,22 [5], 2,23 [6] und 5,74 [7] angegeben. Liegt der R0-Wert nun beim vom RKI angegebenen Wert zwischen 2,8 und 3,8, oder liegt er eventuell darüber oder darunter?

Abb. 9: zeitliche Entwicklung des R-Wertes

Anfang März 2020 lag der Sieben-Tage-R-Wert tatsächlich mit 3,2 in ihrer angegebenen Range von 2,8 bis 3,8 (vgl. Abb. 9). Doch kommt dieser Wert allein aufgrund der damals vorherrschenden Ausbreitungsgeschwindigkeit zustande? Wie bereits zuvor dargelegt, wurden genau zu dieser Zeit die Testkapazitäten massiv ausgebaut.

Zur Erinnerung: Bis einschließlich der 10. Kalenderwoche 2020 wurden insgesamt 69.184 PCR-Tests durchgeführt. Allein in der 11. Kalenderwoche waren es dann bereits 128.008 und in der 12. Kalenderwoche sogar 374.534 durchgeführte PCR-Tests.

Von der elften zur zwölften Kalenderwoche 2020 wurden die durchgeführten Tests somit verdreifacht. Das führt dann dazu, dass mehr Personen mit Infektionen festgestellt werden konnten, für die in den Wochen zuvor noch kein Test hätte angeboten werden können.

Ein deutlicher Anteil des damals hohen R-Wertes liegt daher sehr wahrscheinlich in der Tatsache begründet, dass die Testkapazitäten so massiv ausgebaut wurden. Mit den vorliegenden Zahlen ist deshalb davon auszugehen, dass der R0-Wert unter der vom RKI angegebenen Spanne von 2,8-3,8 liegt.

Intensivstationen

Dass es tatsächlich eine dritte Welle gibt, kann man anhand der belegten Betten auf den Intensivstationen sehen. Seit Mitte März steigen dort wieder die Zahlen der durch Patienten mit einem positiven Covid-19-Test belegten Betten (vgl. Abb. 10).

Abb. 10: belegte Intensivbetten durch Personen mit einem positiven COVID-19-Test, unterteilt in invasiv beatmet (orange) und nicht invasiv beatmet (blau), rot gibt den prozentualen Anteil an beatmeten Patienten an

Aufgrund der Entwicklung wurde berichtet, dass dadurch innerhalb der nächsten drei bis vier Wochen die Intensivbetten komplett belegt sein könnten. Um das etwas genauer einschätzen zu können, lohnt ein Blick auf die täglichen Neuaufnahmen von Patienten mit positivem Covid-19-Test auf den Intensivstationen (vgl. Abb. 11).

Abb. 11: tägliche Neuaufnahmen auf den Intensivstationen von Patienten mit positivem COVID-19-Test

Bis Mitte Februar 2021 fielen die Neuaufnahmen stetig. Von da an bis etwa Mitte März 2021 blieben die Neuaufnahmen stabil und stiegen anschließend wieder an. Das exponentielle Wachstum, welches bei den täglich neu gemeldeten Fallzahlen beobachtet werden konnte, kann in den Neuaufnahmen auf der Intensivstation so nicht gesehen werden.

Die täglichen Neuaufnahmen auf der Intensivstation stiegen vom Tiefpunkt nach der zweiten Welle bisher um rund 47 Prozent, hingegen die gemeldeten Fallzahlen um rund 142 Prozent. Einerseits kann es daran liegen, dass das exponentielle Wachstum bei den gemeldeten Fallzahlen hauptsächlich durch die Aufhellung des Dunkelfeldes durch die massiv eingesetzten Schnelltests aufgetreten ist. Anderseits ist es aber auch möglich, dass die besonders gefährdete Gruppe durch bereits durchgeführte Impfungen nun besser geschützt ist.

Zwar kann es einige Zeit dauern, bis eine infizierte Person auf der Intensivstation behandelt wird. Allerdings vergehen von Infektion bis Erkrankungsbeginn fünf bis sechs Tage. In den meisten Fällen gehen die Personen erst dann zum Arzt, woraufhin ein Test durchgeführt wird. Das Ergebnis liegt dann erst nach mindestens einem Tag vor, welches dann den Gesundheitsämtern gemeldet wird, welches wiederum dann erst die Fallzahlen dem RKI übermittelt.

Beim Vergleich der Kurve der gemeldeten Fallzahlen mit der Kurve der Fallzahlen nach Infektionsbeginn ist auch ein zeitlicher Versatz von rund 1,5 Wochen zu erkennen. Beim Vergleich der Neuaufnahmen auf der Intensivstation mit den gemeldeten Fallzahlen kann festgestellt werden, dass der zeitliche Versatz der Hochpunkte in etwa fünf Tage beträgt. Der stärkere Anstieg der Fallzahlen hätte sich demnach bereits in den Neuaufnahmen auf der Intensivstation widergespiegelt.

Abb. 12: belegte Intensivbetten mit Personen mit positivem COVID-19-Test (rot) und ohne postivem COVID-19-Test (blau), freie Intensivbetten (grün) und Notfallreserve (orange)

Anfang September 2020 waren etwas über 200 Intensivbetten der rund 21.500 belegten Intensivbetten durch Patienten mit positivem Covid-19-Test belegt. Obwohl die Zahl der durch Patienten mit positivem Covid-19-Test belegten Intensivbetten bis zum 03.01.2021 um mehr als 5.500 anstieg, stieg die Zahl der insgesamt belegten Intensivbetten nur um rund 1.000.

Bis zum 10.03.2021 fielen die durch Patienten mit positivem Covid-19-Test belegten Intensivbetten um rund 3.000, dennoch fiel die Zahl der insgesamt belegten Intensivbetten um weniger als 500. Seitdem stiegen die durch Patienten mit positivem Covid-19-Test belegten Intensivbetten bis zum 08.04.2021 um wieder rund 1.750, die insgesamt belegten Intensivbetten stiegen dennoch nie um mehr als 300.

Es zeigt sich, dass die Zahl der insgesamt belegten Intensivbetten nicht mit derselben Zahl wächst oder fällt, wie es die Zahl der durch Patienten mit positivem Covid-19-Test belegten Intensivbetten tut. Deshalb ist davon auszugehen, dass diese Feststellung auch bei einem erneuten Anstieg zu beobachten sein wird. Selbstverständlich spiegeln die Zahlen nur die Intensivbettenkapazitäten wider und nicht die Situation des Pflegepersonals.

Laut DIVI Intensivregister tritt dieses Verhalten auf, weil die Kliniken vom Regelbetrieb auf den Notbetrieb umstellen [8]. Demnach werden planbare Operationen abgesagt bzw. verschoben und andere Patienten früher als üblich auf andere Stationen verlegt.

Auch bei den Zahlen zu den belegten Intensivbetten gibt es Probleme bei der zeitlichen Vergleichbarkeit. Mit der Zeit wurden alle Personen, die stationär in Krankenhäusern aufgenommen wurden, standardmäßig auf Covid-19 getestet. Dadurch gab es Zufallsentdeckungen [9], weil beispielsweise Schwangere vor ihrer Entbindung getestet wurden oder auch Personen, die wegen eines Unfalls eingeliefert wurden.

Für die Krankenhäuser mag die Unterscheidung keine große Rolle spielen, da auch diese Patienten isoliert werden müssen. Für die korrekte Lagebeurteilung zu Personen, die wegen Covid-19 auf den Intensivstationen liegen, ist das allerdings problematisch.

Möglichkeiten, saubere Zahlen zu erhalten

Bisher wurde gezeigt, weshalb die gemeldeten Fallzahlen kaum dazu geeignet sind, die tatsächliche Lage widerzuspiegeln und erst recht nicht, eine zeitliche Vergleichbarkeit zu gewährleisten. Da bisher keine anderen Zahlen vorliegen, müssen natürlich die Zahlen zur Lagebeurteilung genutzt werden, die vorhanden sind. Dabei muss man jedoch immer die zuvor genannten Probleme im Hinterkopf behalten und sie bei der Lagebeurteilung mit einbeziehen.

Doch gibt es keine andere Möglichkeit verlässliche Daten zu erhalten, um die Lage dauerhaft korrekt einschätzen zu können? Mit einem sauberen Studiendesign ist das möglich. Hierzu benötigt man eine Gruppe an Personen, die repräsentativ für die deutsche Bevölkerung herangezogen werden kann.

Wählt man zum Beispiel. 80.000 Menschen aus Deutschland aus (rund ein Promille der Bevölkerung) und testet sie in regelmäßigen Abständen, kann aus den so ermittelten Zahlen die Lage für Deutschland hochgerechnet werden. Die 80.000 Menschen sollten dabei repräsentativ für Deutschland sein, also beispielsweise in Bezug auf die Altersstruktur und Verteilung der Personen auf Deutschland.

Der Abstand der Testungen sollte dabei regelmäßig sein, beispielsweise alle sieben Tage. Besser wäre ein Abstand von vier Tagen, denn dann würde man auch gleich einen sauber berechneten R-Wert erhalten. Bei der Berechnung des R-Wertes werden die Fallzahlen der letzten vier Tage in Relation zu den vier Tagen zuvor gesetzt. Durch das Studiendesign würde man neben dem R-Wert auch sehr sauber hochrechnen können, wie viele Personen aktuell tatsächlich infiziert sind.

Da die zu testende Gruppe repräsentativ für Deutschland stünde und die Testungen nicht von der aktuellen Teststrategie abhängen würden, kann auch direkt das Dunkelfeld ermittelt werden. Nebenbei würde man auch weitere Kennzahlen berechnen können, z.B. wie viele Personen tatsächlich symptomatisch sind und wie hoch die Sieben-Tage-Inzidenz tatsächlich ist. Allerdings wäre der Sieben-Tage-Inzidenz-Wert dann deutlich höher, als er aktuell berechnet ist, da das Dunkelfeld komplett aufgehellt wäre. Das müsste dann entsprechend bei der Lagebeurteilung berücksichtigt werden.

Zusätzlich hätte man auch eine exakte Altersverteilung der Infizierten und wie sich die Altersverteilung mit der Zeit verändert. Man wüsste auch, welche Personengruppen sich infiziert haben, beispielsweise welche Gruppen von Arbeitnehmern oder Pflegeheimbewohnern. Auch diese Zahl hängt dann nicht mehr von der aktuell gültigen Teststrategie ab, wodurch das Ergebnis auch entsprechend nicht verfälscht werden kann. Weiterhin könnte man sehr genau berechnen, wie die aktuellen Virusvarianten in der Bevölkerung zirkulieren.

Bei jeder Testung kann grundsätzlich eine neue Menge von 80.000 Personen getestet werden, die dann wieder repräsentativ für Deutschland steht. Eine Testung immer derselben Personengruppe würde jedoch noch weitere Vorteile mit sich bringen. Man könnte jeweils den Ct-Wert ermitteln und sehen, wie sich dieser über die Zeit entwickelt und bei welchen Ct-Werten die Personen symptomatisch sind. Ct-Wert steht hierbei für "Threshold Cycle" und gibt an, wie viele Zyklen beim PCR-Test durchlaufen werden mussten, bis ein positives Signal erreicht wurde. Je höher daher der Wert, desto geringer war die Viruslast der Probe.

Man könnte zusätzlich Antikörpertests durchführen und feststellen, nach wie vielen Tagen Antikörper ausgebildet werden und wie lange die Antikörper nachweisbar sind. Auch könnte man feststellen, wie niedrig der Ct-Wert bei Personen war, die Antikörper entwickelt haben. Da nur rund ein Promille der Bevölkerung getestet wäre, könnte man bei Beibehaltung der Testgruppe die Verstorbenen dieser Gruppe standardmäßig obduzieren und so ermitteln, wieviele an Corona verstorben sind. Das wären bis heute rund 76 Personen gewesen. So ließe sich eine saubere Infizierten-Fallsterblichkeit (IFR) berechnen.

Bei den Zahlen der Intensivpatienten wäre es notwendig, dass neben der Zahl an belegten Intensivbetten durch Patienten mit einem positiven Covid-19-Test, die aber wegen etwas anderem intensivmedizinisch behandelt werden, auch die Zahl an Intensivbetten gemeldet wird, die wegen Covid-19 auf der Intensivstation behandelt werden.

Durch ein gut gewähltes Studiendesign ist es also möglich, verlässliche Zahlen zu erhalten. Die so ermittelten Zahlen lassen kaum Raum für Interpretationen zu, weshalb so auch Verschwörungstheorien die Grundlage entzogen wäre.

Autor: Daniel Haake, M.Sc. in Data Science, ausgezeichnet mit dem Gerhard-Fürst-Preis 2020 des Statistischen Bundesamtes, aktuell tätig als Senior Data Scientist


URL dieses Artikels:
https://www.heise.de/-6014875

Links in diesem Artikel:
[1] https://Covidmonitor.unbelievable-machine.com/
[2] https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Steckbrief.html#doc13776792bodyText5
[3] https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Steckbrief.html#doc13776792bodyText4
[4] https://www.heise.de/tp/features/Was-uns-die-Covid-19-Daten-sagen-und-was-nicht-6014875.html?view=fussnoten#f_1
[5] https://www.heise.de/tp/features/Was-uns-die-Covid-19-Daten-sagen-und-was-nicht-6014875.html?view=fussnoten#f_2
[6] https://www.heise.de/tp/features/Was-uns-die-Covid-19-Daten-sagen-und-was-nicht-6014875.html?view=fussnoten#f_3
[7] https://www.heise.de/tp/features/Was-uns-die-Covid-19-Daten-sagen-und-was-nicht-6014875.html?view=fussnoten#f_4
[8] https://www.zeit.de/amp/news/2021-04/19/welches-argument-im-intensivbetten-streit-irrefuehrend-ist
[9] https://www.presseportal.de/pm/9377/4840896