Was uns die Covid-19-Daten sagen – und was nicht

Seite 6: Möglichkeiten, saubere Zahlen zu erhalten

Bisher wurde gezeigt, weshalb die gemeldeten Fallzahlen kaum dazu geeignet sind, die tatsächliche Lage widerzuspiegeln und erst recht nicht, eine zeitliche Vergleichbarkeit zu gewährleisten. Da bisher keine anderen Zahlen vorliegen, müssen natürlich die Zahlen zur Lagebeurteilung genutzt werden, die vorhanden sind. Dabei muss man jedoch immer die zuvor genannten Probleme im Hinterkopf behalten und sie bei der Lagebeurteilung mit einbeziehen.

Doch gibt es keine andere Möglichkeit verlässliche Daten zu erhalten, um die Lage dauerhaft korrekt einschätzen zu können? Mit einem sauberen Studiendesign ist das möglich. Hierzu benötigt man eine Gruppe an Personen, die repräsentativ für die deutsche Bevölkerung herangezogen werden kann.

Wählt man zum Beispiel. 80.000 Menschen aus Deutschland aus (rund ein Promille der Bevölkerung) und testet sie in regelmäßigen Abständen, kann aus den so ermittelten Zahlen die Lage für Deutschland hochgerechnet werden. Die 80.000 Menschen sollten dabei repräsentativ für Deutschland sein, also beispielsweise in Bezug auf die Altersstruktur und Verteilung der Personen auf Deutschland.

Der Abstand der Testungen sollte dabei regelmäßig sein, beispielsweise alle sieben Tage. Besser wäre ein Abstand von vier Tagen, denn dann würde man auch gleich einen sauber berechneten R-Wert erhalten. Bei der Berechnung des R-Wertes werden die Fallzahlen der letzten vier Tage in Relation zu den vier Tagen zuvor gesetzt. Durch das Studiendesign würde man neben dem R-Wert auch sehr sauber hochrechnen können, wie viele Personen aktuell tatsächlich infiziert sind.

Da die zu testende Gruppe repräsentativ für Deutschland stünde und die Testungen nicht von der aktuellen Teststrategie abhängen würden, kann auch direkt das Dunkelfeld ermittelt werden. Nebenbei würde man auch weitere Kennzahlen berechnen können, z.B. wie viele Personen tatsächlich symptomatisch sind und wie hoch die Sieben-Tage-Inzidenz tatsächlich ist. Allerdings wäre der Sieben-Tage-Inzidenz-Wert dann deutlich höher, als er aktuell berechnet ist, da das Dunkelfeld komplett aufgehellt wäre. Das müsste dann entsprechend bei der Lagebeurteilung berücksichtigt werden.

Zusätzlich hätte man auch eine exakte Altersverteilung der Infizierten und wie sich die Altersverteilung mit der Zeit verändert. Man wüsste auch, welche Personengruppen sich infiziert haben, beispielsweise welche Gruppen von Arbeitnehmern oder Pflegeheimbewohnern. Auch diese Zahl hängt dann nicht mehr von der aktuell gültigen Teststrategie ab, wodurch das Ergebnis auch entsprechend nicht verfälscht werden kann. Weiterhin könnte man sehr genau berechnen, wie die aktuellen Virusvarianten in der Bevölkerung zirkulieren.

Bei jeder Testung kann grundsätzlich eine neue Menge von 80.000 Personen getestet werden, die dann wieder repräsentativ für Deutschland steht. Eine Testung immer derselben Personengruppe würde jedoch noch weitere Vorteile mit sich bringen. Man könnte jeweils den Ct-Wert ermitteln und sehen, wie sich dieser über die Zeit entwickelt und bei welchen Ct-Werten die Personen symptomatisch sind. Ct-Wert steht hierbei für "Threshold Cycle" und gibt an, wie viele Zyklen beim PCR-Test durchlaufen werden mussten, bis ein positives Signal erreicht wurde. Je höher daher der Wert, desto geringer war die Viruslast der Probe.

Man könnte zusätzlich Antikörpertests durchführen und feststellen, nach wie vielen Tagen Antikörper ausgebildet werden und wie lange die Antikörper nachweisbar sind. Auch könnte man feststellen, wie niedrig der Ct-Wert bei Personen war, die Antikörper entwickelt haben. Da nur rund ein Promille der Bevölkerung getestet wäre, könnte man bei Beibehaltung der Testgruppe die Verstorbenen dieser Gruppe standardmäßig obduzieren und so ermitteln, wieviele an Corona verstorben sind. Das wären bis heute rund 76 Personen gewesen. So ließe sich eine saubere Infizierten-Fallsterblichkeit (IFR) berechnen.

Bei den Zahlen der Intensivpatienten wäre es notwendig, dass neben der Zahl an belegten Intensivbetten durch Patienten mit einem positiven Covid-19-Test, die aber wegen etwas anderem intensivmedizinisch behandelt werden, auch die Zahl an Intensivbetten gemeldet wird, die wegen Covid-19 auf der Intensivstation behandelt werden.

Durch ein gut gewähltes Studiendesign ist es also möglich, verlässliche Zahlen zu erhalten. Die so ermittelten Zahlen lassen kaum Raum für Interpretationen zu, weshalb so auch Verschwörungstheorien die Grundlage entzogen wäre.

Autor: Daniel Haake, M.Sc. in Data Science, ausgezeichnet mit dem Gerhard-Fürst-Preis 2020 des Statistischen Bundesamtes, aktuell tätig als Senior Data Scientist

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier eine externe Buchempfehlung (Amazon Affiliates) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Amazon Affiliates) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.