Zur Bruttokinetik des SARS-CoV-2 Infektionsgeschehens, oder: Weshalb nicht jeder R-Wert eine Reproduktionszahl ℛ ist

Seite 4: Anhang

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

[1] Die Zeitachse - Daten und deren Aufbereitung Für die Schätzung der amtlichen R-Werte gemäß Berechnungsvorschriften [3.4] ist die Zeitachse ohne Relevanz, da nur Verhältnisse von Neuinfektionszahlen gebildet werden. Für die Ermittlung des Anstiegs der Infektionszahlkurve ist die Zeitachse essentiell, d.h. es muss ein Tag 1 definiert werden, an dem der erste oder die ersten SARS-CoV-2 Infektionsfälle registriert werden.

Für Deutschland habe ich, wie für Teil 1 und Teil 2, Tag 1 auf den 27.01.20 festgelegt (Beginn des begrenzten Ausbruch in der Firma Webasto). Ergänzend mache ich hier eine zweite Auswertung mit verschobener Zeitachse und einem Tag 1 am 15.02.20, dem Tag, als ein infiziertes Ehepaar während einer Karnevalssitzung in der Gemeinde Gangelt, Kreis Heinsberg, NRW, zahlreiche Teilnehmer angesteckt haben soll. Wann und wo sich das Ehepaar infiziert hatte, konnte meines Wissens nicht geklärt werden, so dass sich die Frage nach einem unbekannten "Superspreader" stellt (Welch ein Importwort! Was wohl Friedrich Schiller dazu gesagt hätte?). Zum Epidemie-Ausbruch in Deutschland siehe auch (i), (ii), (iii).

Ich verwende für diesen Beitrag die von der Berliner Morgenpost [2.1] seit dem 27. 01.20 berichteten Daten, nicht die amtlichen Zahlen [2.2]. Auch hier werde ich auf die mir bekannten und bis zum Erbrechen vorgebrachten Einwände [2.3] gegen praktisch alle zur Verfügung stehenden Daten zur SARS-CoV-2 Pandemie nicht eingehen. Ich hätte dann diesen Artikel nicht schreiben können und sie dem R-Wert überlassen. Wenn sie das wünschten, bitte wechseln sie zu einem anderen Beitrag bei Heise/TP!

Für die VR China benutze ich die gemittelten Daten der Morgenpost, von Our World in Data, hier auf GitHub und vom Worldometer. Die Daten aus den verschiedenen Quellen unterscheiden sich nicht gravierend, teils sind sie um einen Tag verschoben. Für die Daten "Welt" der Morgenpost, wurden die enthaltenen China-Zahlen abgezogen.

Alle Daten für die Infektionszahlen Y über der Zeit x, werden vor der Analyse mit einem zentrierten, gleitendem 7-Tage-Mittel geglättet, für China mit einem 15-Tagemittel. Die berechneten P-Werte trage ich über dem zweiten Tag der äquidistanten Zeitintervalle x1 bis x2 von je drei Tagen auf. Die berechneten Werte (Q x) werden durch ein zentriertes, gleitendes 7-Tagemittel geglättet. Die vergleichsweise dargestellten R/7-Werte sind nach amtlicher Vorschrift berechnet und werden über dem letzten Tag des betrachteten Zeitintervalls aufgetragen.

Dies ist schon alles, was uns in die Lage versetzt, anhand von Daten für die Infektionszahlentwicklung, den zeitlichen Verlauf der Infektionsrate P zu berechnen und darzustellen.

[2] SARS-CoV-2 Zahlen

2.1 Daten Berliner Morgenpost: Für diesen Beitrag verwende ich ausschließlich die Fallzahlen der Berliner Morgenpost, diese sind tageweise rückverfolgbar bis zum 27.01.20. Auch die Daten der Berliner Morgenpost wurden rückwirkend korrigiert. Zu den Quellen vergleiche man die Angaben auf der Webseite, für deren Inhalt und Gestaltung steht das Interaktiv-Team der Funke Mediengruppe: Marie-Louise Timcke, André Pätzold, David Wendler, Sebastian Vollnhals und Christopher Möller.

Diese "Fallzahlen" stehen für Menschen, die positiv auf das SARS-CoV-2 Virus getestet wurden. Ich spreche ausschließlich von Infizierten und von Infektionen.

2.2 Amtliche Nowcast Daten: Wer Beispielberechnungen zur Infektionsrate P auf Basis der amtlichen Daten sehen möchte, den verweise ich hierhin.

Ich verwende die amtlichen Daten in diesem Beitrag aus den folgenden Gründen nicht:

Wir alle haben, insbesondere in den ersten Wochen des epidemischen Geschehens, immer wieder vernommen, dass die amtlich seit dem 04.03.20 in täglichen Lageberichten mitgeteilten "Fallzahlen" denen anderer Quellen hinterherhinken, was nichts mit Unfähigkeit im Amt, sondern ausschließlich mit dem offiziellen Meldeweg in Zusammenhang steht. Fachwissenschaftler haben deshalb ein Verfahren, das Nowcasting, entwickelt, mit dem die Fallzahlen rückwirkend (und bedingt vorausblickend) korrigiert bzw. geschätzt werden. Nach meinem Eindruck hat die nachträgliche Imputation fehlender Daten aber insbesondere für den Monat März zu einer Überbewertung der Fälle geführt, ich hatte bereits im Teil 2 darauf verwiesen. Ein Beispiel: Am Sonntag, dem 08.03.20 wurden für Deutschland erstmals etwa 1 000 ± 100 Infektionsfälle gemeldet. Dies war Gegenstand der Abenddiskussion bei Anne Will. Mit Stand 08.03. 15:00 wurden amtlich 902 bestätigte Fälle gemeldet, von denen elektronisch nur 447 übermittelt worden seien. Die EXEL-Tabelle zum Nowcasting weist im Nachhinein für den 08.03. aber 3 289 kumulierte Fälle aus (Stand 22.07.20; 00:00 Uhr).

Die kumulierten Fälle des Nowcasting vom 22.07.20 für den letzten Nowcast-Tag, dem 18.07.20, ergeben die Infektionszahl von 198 270. Im Lagebericht für den 18.07., also im Bericht vom 19.07.20, 00:00 Uhr, werden hingegen 201 574 Fälle genannt, das sind nun ca. 3 300 mehr als im Nowcasting erfasst. Ich habe gewisse Zweifel, ob die amtlichen Fallzahlen die gewesene Realität wirklich besser als andere Quellen abbilden. Und zuletzt: Die Nowcasting-Ergebnisse werden auch für länger zurückliegende Zeiträume täglich korrigiert. Ich kann mit lebenden Zahlen schlecht umgehen.

Die Nowcasting-Daten werden ab dem 02.03.20 mitgeteilt, daraus berechnete R/4-Werte aber ab dem 06.03., wozu die Zahlen ab dem 28.02.20 benötigt werden. Ich bin sicher: Das alles kann man erklären. Einen Erklärungsversuch finden sie hier.

Vermerkt sei noch, dass die in der Nowcasting-EXEL-Tabelle angegebenen RA-Werte variieren können, nicht nur wegen nachträglicher Korrekturen von Fallzahlen, sondern auch wegen der täglichen Verschiebung der Zeitachse für die Summenbildung [3.5]. Dies ist ein Grund, weshalb wir auch im RA/4-Wert nun weniger Werte R≈1 sehen, als noch im April/Mai.

2.3 Die "Qualität der Daten" zu Neuinfektionen und Fallzahlen ist auch mit einigem Recht zu bemängeln (aber so ist die Realität): Beispielsweise ist die schwankende Zahl an Neuinfektionen insbesondere und nach wie vor im Wochenverlauf auffällig, die unbekannte Dunkelziffer an asymptomatischen COVID 19 Fällen, der Einfluss der Anzahl der Tests und nicht zuletzt die Frage der Repräsentanz einer Stichprobe aus einer inhomogenen Grundgesamtheit, wobei die Stichprobe selbst nicht zufällig genommen wird. Die Repräsentanz halte ich übrigens für ein wirklich gravierendes Problem. Andere lassen sich zumindest im Nachhinein noch korrigieren.

[3] Über die Reproduktionszahl und R-Werte

3.1 Der Hype um den Buchstaben "R": Zunächst sprach man von einem "exponentiellen Anstieg", einer Begrifflichkeit, der etwas Gefährliches inhärent wurde. Dann kannte man noch einen "linearen Anstieg": weniger Gefahr. Und nachdem man sich von einer "Verdopplungszeit" verabschiedete, weil diese wahrscheinlich zu groß geworden war, um gefährlich zu sein (Es hieß doch tatsächlich, diese werde wegen mathematischer Probleme nicht mehr berechnet, weil wir nicht mehr in der "exponentiellen Phase" wären; oh mein Gott; und das von einem Wissenschaftler, wem wollte er sich andienen?), brachte man einen epidemiologischen Kennwert, die Reproduktionszahl ℛ, ins Spiel: Und ℛ = 1,3 bedeutete am 15. April, dass im Juni das Gesundheitssystem überlastet sein würde, bedeutete also sehr große Gefahr (Sie können den Modellbetrachtungen Vertrauen schenken!). Für einen Moment befand sich auch deutsche Politik auf einem Grat zu einer Politik zum Fürchten. Dies hielt ich für gefährlicher als eine berichtete Zahl für den R-Wert von R = 1,3.

Was dann passierte, ist eigentlich kaum zu glauben: Eine Zahl aus der Wissenschaft, ein Begriff, der Anwärter auf das Wort des Jahres sein wird, die Reproduktionszahl ℛ, fälschlicher Weise synonym mit dem sogenannten "R-Wert" gebraucht, war für Wochen in aller Munde, für Monate in allen Medien. Es hieß es sogar, der R-Wert sei ein wichtiger Indikator dafür, um über Lockerungen der Corona Maßnahmen zu entscheiden.

Wie konnte dies geschehen, dass "R" zu einer politischen Zahl wurde, nach einer dreiminütigen Antwort der Kanzlerin auf die Frage eines Journalisten während der Pressekonferenz am 15. April (ab Minute 36:15): ... "Was ist die derzeitige Strategie für den Umgang mit der Pandemie"…? Ganze 60 Sekunden der Antwort zu Modellbetrachtungen mit verschiedenen R-Werten reichten, um Lawinen von Artikeln, Nachrichten, Kommentaren, "Hintergrundinformationen", Talkshows, in praktisch allen Medien auszulösen. Alle haben mitgemacht! Ein "R" war wichtiger als der Kern der Merkel - Antwort: Beherrschbare, nachverfolgbare Zahl von Neuinfektionen und geeignete Schutzkonzepte der Gesundheitsämter. Vier Wochen später war es die Kanzlerin, eine der wenigen, die sich rasch vom "R" verabschiedeten, die noch einen Eingreif-Schwellenwert für Neuinfektionen pro Einwohner und Zeiteinheit durchsetzen konnte, gegen die Schnellöffner: 50 Infizierte pro 100 000 Einwohner und Woche, also im Mittel etwa 570 tägliche Neuinfektionen für Deutschland. Die Zahl 50 war einigen noch zu klein.

3.2 Die Reproduktionszahl ℛ ist ein epidemiologischer Kennwert, der einen Elementarprozess im epidemischen Verlauf, die Infizierung, quantifiziert und dessen Zahlenwert angibt, wie viele Personen im Mittel ein Infizierter ansteckt. In Deutschland kennt man die Reproduktionszahl ℛ sehr gut, denn diese Zahl wurde von der Bundeskanzlerin erklärt. Für einen Wert ℛ = 1 ist definiert, dass ein "mittlerer" Infizierter in einer "mittleren Umgebung" (dies ist wahrscheinlich nicht in Berlin - Mitte) nur eine weitere Person ansteckt. Wenn dies für eine gewisse Zeit andauerte, dann wäre der Anstieg der kumulativen Infektionszahl gemäß einer Gleichung Y(x) = k + F x mit k = 0 über der Zeit linear. Auf Zeit-Online gab es einen ziemlich guten Artikel über die Reproduktionszahl.

Die Reproduktionszahl ℛ kann man als Kennwert diskutieren, ohne irgendeine Berechnung gemacht zu haben. Dafür muss man weder Mathematik studieren noch PhysikerIn sein. Deshalb kann auch ein Dreizehnjähriges Mädel, z.B. die Tochter von Herrn Dr. Lauterbach, die Konsequenzen verschiedener Zahlenwerte ℛ erklären. Ein Messgerät zur Bestimmung des Wertes ℛ wurde bisher nicht erfunden.

3.3 R-Wert: Der R-Wert ist das Ergebnis einer wissenschaftlich, epidemiologisch begründeten, mathematischen Modellierung eines "mittleren" Infektionsvorgangs. Ziel dieser mathematischen Modellierung ist, einen Zahlenwert zu berechnen, den R-Wert, der möglichst die Reproduktionszahl ℛ abbildet, ihr im Idealfall entspricht.

Bevor mir jemand einen R-Wert mitteilt, muss er eine Berechnung durchgeführt, und vielleicht sogar einen Nachweis in der Tasche haben, dass die berechnete Zahl R auch sehr wahrscheinlich die Reproduktionszahl ℛ ist. Hat dies einmal jemand nachgefragt?

Es ist mir nicht bekannt, ob es bislang ein unabhängiges Kriterium dafür gab, ob R = ℛ erfüllt ist. Es gibt nun epidemiologisch-mathematische Modelle zur Berechnung/ Abschätzung der Infektionsausbreitung. Diese werden benutzt, um Szenarien möglicher Entwicklungen für die Zukunft zu prognostizieren. Darauf hatte Frau Merkel Bezug genommen, als sie in der 60 Sekundenantwort einleitend sagte: Wir haben Modellbetrachtungen gemacht.

Wenn solche Modelle für Zukunftsprognosen benutzt werden, kann damit auch die Vergangenheit "nachgerechnet" werden. So ist heraus zu finden, ob ein wie auch immer erhaltener R-Wert geeignet ist, die vergangene Infektionszahlentwicklung abzubilden. Derartige Rechnungen mit Modellen für die Infektionsausbreitung sind ganz bestimmt auch für die Vergangenheit durchgeführt worden. Öffentlich gewordene Ergebnisse sind mir nicht bekannt. Hat dies einmal jemand nachgefragt?

Einige werden meine Unterscheidung zwischen Reproduktionszahl ℛ und R-Wert kleinlich finden; für mich ist diese Unterscheidung notwendig und hilfreich beim Denken.

3.4 Theorie des R-Wertes: Ich könnte versuchen, Papierausdrucke der wissenschaftlichen Arbeiten zur Theorie der Reproduktionszahl, also zur Berechnung des R-Wertes oder zur Schätzung des Wertes ℛ auf einen Stapel zu legen. Was glauben sie, wie viele Meter an bedrucktem Papier zusammenkämen? Geben sie einmal hier "theory reproduction number corona" ein. Bei mir erscheinen ca. 31 400 Ergebnisse, von denen ich nur neun mehr oder weniger zufällig auswähle: Einen Beitrag aus dem Helmholtz-Zentrum für Infektionsforschung, Abteilung System-Immunologie, dazu Berechnung und Ergebnisse auch hier; ein Beitrag der LMU München, ein Beitrag aus dem Karlsruher Institut für Technologie und von der TU Ilmenau; ein methodischer Vergleich unter Berücksichtigung der amtlichen deutschen Berechnung; ein Beitrag zur Berechnung von R0; zur Komplexität von R0 (schon das Abstract hat es in sich) und zur effektiven Reproduktionszahl; zu Methodenvergleichen... Die verlinkten Artikel sind alle download-bar. Schauen sie ruhig einmal rein, dann wird der eine oder andere verstehen, weshalb ich mich nicht mit R-Wert Modellen befassen wollte. Einen Drang zum Hobby-Epidemiologen im Schaukelstuhl habe ich nie verspürt.

Tausende von Fachartikeln über die Reproduktionszahl? Warum nicht ein einziger, der alles erklärt? Ach: Sie dachten, Wissenschaft sei, wenn lauter kleine und mittelgroße Einsteins sich täglich treffen, Experimente planen, diese durchführen und auswerten, über physikalisch-mathematische Modelle oder Theorien brüten, national und international vernetzt, und selbstverständlich ohne jeglichen Eigennutz oder gar Konkurrenzgedanken miteinander arbeiten, und am Ende des Tages, zumindest nach einer Woche, ist eine Erfindung fertig. Große Enttäuschung: Wissenschaft gehorcht einer Dialektik, und mitunter braucht es sehr viel Quantität um die neue Qualität zu entdecken.

3.5 Der amtliche R-Wert für Deutschland (RA) ist gemäß Berechnungsvorschrift der Quotient aus der Summe von Neuinfektionen der letzten vier Nowcast-Tage und der Summe der Neuinfektionen der vier davor liegenden Tage. Die Berechnungsvorschrift für den so geschätzten R-Wert und die geschickt gewählten "Wenn - Dann - Aussagen" bilden/bildeten eine in sich stimmige Einheit (dachte ich, siehe im Artikel). Veröffentlicht wird das Ergebnis am Tag x+4, 00:00 Uhr, wobei x der letzte Nowcast-Tag ist.

Während der R-Wert, auch R/4 genannt, epidemiologisch begründet und mit Bezug auf wissenschaftliche Publikationen definiert wurde, fand der im Mai eingeführte R/7 Wert eine Begründung durch zu große Sensitivität des R/4-Wertes. Der R/7-Wert ist der Quotient aus der Summe der Neuinfektionen der letzten sieben Nowcast-Tage und der Summe der Neuinfektionen von vorgelagerten sieben Tagen, die mit den letzten sieben Tagen für vier Tage überlappen.

Auf der Basis von Imputation und Nowcasting geschätzter Zahlen für tägliche Neuinfektionen ermittelte zeitabgängige R-Werte treffen eine relative Aussage über die Entwicklung der Anzahl der Neuinfektionen. Nicht mehr, aber auch nicht weniger. Dr. Matthias an der Heiden sprach in der Pressekonferenz am 30. April diesbezüglich einmal von einer prozentualen Änderung, was wohl die anwesenden Journalisten überhörten oder nicht einordnen konnten.

Ich definiere die amtlichen RA-Werte als kinetische Parameter: Quotienten zweier Geschwindigkeiten, die vier Tage auseinander liegen.

P.S.: Liebe Leserin, lieber Leser: Sollten Sie tatsächlich bis zu dieser Stelle gelesen und den Eindruck gewonnen haben, sie hätten nach zwei Proben einer Premiere, die gleichzeitig die Abschiedsvorstellung war, beigewohnt, dann können sie nun ihre Kritik schreiben und deren Link, vielleicht sogar den Link zu meinem Artikel, möglichst breit verteilen. So kämen auch andere, die versäumen, das Journal von Heise/TP regelmäßig zu lesen in den Genuss ihrer Kritik. Und vielleicht erreichen ihre Kritik und mein Artikel sogar einmal das zuständige Amt, denn von den drei meiner bisherigen Versuche einer Kontaktaufnahme endeten zwei in der Zentralen Posteingangsstelle oder zuletzt - immerhin, ich war also aufgestiegen - in der Pressestelle, und wurden mit freundlichen vorgefertigten Antworten bedacht. Ab morgen nehme ich wieder das Thera-Band.