Citizen Data Journalism: die Rückeroberung der Information

Michael Erle

Wie offene Daten und Tools zur Modellierung den demokratischen Austausch begünstigen können

Deutschland ist notorisch das Land der 80 Millionen Bundestrainer. Mit der Covid-19-Pandemie, so wird bisweilen kritisiert, haben wir uns zu einem Volk der Hobby-Epidemiologen gewandelt. Ein oft erhobener Vorwurf ist, dass frei zugängliche Daten simplifiziert verwendet werden, um Forderungen nach bestimmten Maßnahmen im Umgang mit Pandemie zu untermauern. Dieses "Cherry Picking" ist in der Tat eine der prominentesten Taktiken der Desinformation.

Diese Kritik darf aber nicht über den Nutzen hinwegtäuschen, den der öffentliche Zugang zu Daten und die Verfügbarkeit von Tools zur Analyse und Modellierung mit sich bringen. Sie ermöglichen es jedem einzelnen – vorbei an Thinktanks, Regierungssprechern oder Lobby-Verbänden – die Entwicklung in kritischen Bereichen wie der Covid-19-Pandemie zu verfolgen. So wird es möglich, Vorschläge zu Maßnahmen besser zu bewerten, die in die öffentliche Diskussion eingebracht werden. Auch der Dialog über Alternativen kann so unterstützt werden.

Citizen Data Modeling im Einsatz

Diesen Ansatz verfolgen Menschen wie Dirk Paessler, Gründer des Software-Unternehmens Paessler AG und jetzt im Hauptberuf CEO eines Klima-Startups. In beiden Firmen gehören Datenanalysen zum Alltag. Seine Coping-Strategy für die Pandemie ist die Aufarbeitung der Daten und die Modellierung des weiteren Verlaufs.

Diese Beschäftigung mit den Zahlen ist natürlich auch der Versuch, etwas gegen die von uns allen erlebte Hilflosigkeit zu tun. Bei der Datenanalyse kann man im ersten Schritt lernen, wie die Zusammenhänge sind, um dann im zweiten Schritt auf die Suche nach Lösungen zu gehen. Gerade bei komplexen Problemen wie dem Klima oder eben auch der Pandemie finden sich dabei schnell bestimmte Hebel, die eine große Wirkung haben können, die man intuitiv unterschätzt hätte.

Dirk Paessler

Um die Diskussion über Covid-19-Maßnahmen mit Fachinformationen zu unterstützen, hat Paessler ein Modell zur Simulation des weiteren Verlaufs der Pandemie unter verschiedenen Szenarien entwickelt. In seinem Blog veröffentlicht er regelmäßig aktuelle Berechnungen, so etwa eine zum jüngsten Vorschlag des "Brückenlockdowns". Die zugrundeliegenden Daten bezieht er von Institutionen wie dem Robert-Koch-Institut (RKI), offenen Datensätzen und wissenschaftlichen Veröffentlichungen. Das gesamte Modell liegt als dokumentierte Open-Source Datei vor.

Wie sieht demnach die aktuelle Prognose des Pandemie-Verlaufs in Deutschland aus? Wie wirken sich verschiedene Vorschläge aus, und was sind die Kosten an Menschenleben und chronisch Kranken? Beispielhaft sei hier ein Szenario dargestellt, das folgende Annahmen voraussetzt:

  • Keine weiteren Lockdowns
  • Impfprogramm wie geplant

Es ergibt sich dann folgende Verlaufskurve:

Die Modellrechnung zeigt einen exponentiellen Anstieg, weil es keine oder kaum neue Gegenmaßnahmen gibt und die seit Dezember geltenden Lockdown-Regeln nicht ausreichen, um das Wachstum der infektiöseren Virus-Variante B 1.1.7 und anderer Mutationen auszubremsen.

Die rechte Grafik zeigt, dass die Belastung der Intensivstationen in der dritten Welle doppelt so hoch ausfallen würde wie in der zweiten Welle, wenn es keine Verschärfungen gibt. Fast identische Aussagen kommen auch aus dem Modell des Intensivregisters Divi.

"Bundes-Notbremse" und "Jojo-Lockdown"

Die aktuelle Strategie zur Eindämmung der dritten Welle ist im frisch novellierten Infektionsschutzgesetz enthalten. Es definiert für Landkreise einen Inzidenzwert von 100 als Auslöser für Lockdown-Maßnahmen. Dabei sollten Schulen bis zu einem Inzidenzwert bis 200 offen bleiben. Was wären die Folgen?

Mit dem Modell hat Paessler das exemplarisch für eine ganz durchschnittliche Großstadt mit 250.000 Einwohnern durchgerechnet, d.h. eine Stadt, die die gleiche Inzidenzsituation hat wie Deutschland.

"Ab Mai sinken die Fallzahlen (durch die Wirkung der Impfungen), über den Sommer liegt in unserer Musterstadt die Inzidenz um 30 herum. Aber es gibt ein Problem: Ab Juli findet das komplette Infektionsgeschehen praktisch nur noch bei Kindern und Jugendlichen unter 16 Jahren statt, denn diese Gruppe ist noch gar nicht geimpft. Jede Woche infizieren sich 60 Menschen, und zwar fast nur noch Kinder und Jugendliche. In dieser Altersgruppe liegt die Inzidenz im Sommer bei über 100 und steigt dann im Herbst auf mehrere Hundert an", analysiert Dirk Paessler.

Deutschlandweit betrachtet würde das etwa 15.000 infizierte Jugendliche ergeben, jede Woche. Dazu 20.000 Sterbefälle und 260.000 Long-Covid-Patienten bis zum Herbst.

Das Problem der ungewissen Saisonalität

Es ist eine wohlbegründete Annahme, dass Covid-19 wie auch andere Krankheiten, die von Corona-Viren ausgelöst werden, saisonalen Effekten unterliegt. Die berühmte "Grippesaison" stützt diese Annahme. Die Frage ist, wie stark dieser Effekt ist. Reicht er aus, um die Pandemie einzudämmen? Das RKI geht davon aus, dass der Einfluss relativ schwach ist und verwendet in seinen Modellen eine Absenkung der Basisreproduktionszahl ("R-Wert") um 0,2 Punkte.

Auch Paessler verwendet diesen Wert. Doch diese Zahl ist nicht gut belegt, in der Tat ist die Erkenntnislage bei der Saisonalität schlecht. Drei Faktoren könnten dazu beitragen, dass in den Sommermonaten weniger Ansteckungen stattfinden, durch Temperatur, Luftfeuchtigkeit, UV-Strahlung und verändertes Sozialverhalten.

Eine aktuelle Studie analysiert den Ausbruch der "zweiten Welle" in den Ländern Europas auf den Zusammenhang mit den genannten Faktoren. Stephan Walrand zeigt in "Autumn COVID-19 surge dates in Europe correlated to latitudes, not to temperature-humidity, pointing to vitamin D as contributing factor", dass Temperatur und Luftfeuchtigkeit nicht mit dem Ausbruch der Wellen in den verschiedenen Ländern korrelieren – wohl aber der Sonnenstand – und damit die UV-Strahlung.

Ein wesentlicher Effekt des Sonnenlichts ist die Bildung von Vitamin D, dessen Einfluss auf das Immunsystem gut dokumentiert ist. Walrands Ergebnisse könnten auch erklären, warum saisonale Effekte in Ländern außerhalb Europas schwächer sind: Die stärkere Hautpigmentierung großer Teile der Bevölkerung senkt den positiven Effekt der Sommermonate – und damit den saisonalen Effekt.

Eine weitere Schlussfolgerung ist, dass People of Color in Mittel- und Nordeuropa stärker von Covid-19 gefährdet sind und möglicherweise Priorität bei der Impfreihenfolge erhalten sollten. Die Priorisierung der Notunterkünfte in Deutschland erfüllt diese Funktion nur zu einem geringen Teil.

Die Tatsache, dass der Effekt der Saisonalität so deutlich erkennbar ist, während der Effekt von Lockdowns nach wie vor schwer nachzuweisen ist – die aktuelle, breit angelegte Vergleichsstudie "Stay-at-home policy is a case of exception fallacy: an internet-based ecological study" von R. F. Savaris, G. Pumi, J. Dalzochio & R. Kunst kann etwa keinen Effekt nachweisen – belegt keinesfalls, dass Lockdowns wirkungslos sind.

Sie deutet aber darauf hin, dass der Effekt der Saisonalität so stark ist, dass er auch aus dem Datenrauschen der empirischen Forschung heraussticht. Die Absenkung von 0,2 Punkten, die das RKI annimmt, ist möglicherweise zu gering.

Wie tragen Modelle wie das von Dirk Paessler dazu bei, diese Frage zu klären? Ein Beispiel könnte das demonstrieren. Im ersten Fall wird der saisonale Effekt stärker angesetzt – der R-Wert verringert sich zur Sommersonnenwende um 50 Prozent bei einem sinusförmigen Verlauf. Mit einem dem März ähnlichen Lockdown bis zum Jahresende ergäbe sich dann folgendes Bild:

Die Modellrechnung zeigt, dass die dritte Welle ohne Gegenmaßnahmen auch unter Annahme eine sehr starken Saisonalität von 50 Prozent noch zu untragbaren Verhältnissen auf den Intensivstationen führen würde. Im Vergleich: Bei einem Lockdown ab 26.4.2021 würde sich auch noch eine enorme Welle ergeben, aber man würde viel schneller bei niedrigen Inzidenzen ankommen. Eine vorsichtige Öffnung könnte circa sechs Wochen früher erfolgen.

Dirk Paessler hat mit seinem Modell auch schon sogenannte "Nocovid"-Strategien betrachtet und mit anderen Strategien verglichen:

Seine abschließende Analyse lautet: "Ein Lockdown mit nachfolgender Niedrig-Inzidenz-Strategie ("Nocovid") wäre die wesentlich wirksamere und risikoärmere Lösung als auf eine starke Wirkung der Saisonalität zu hoffen."

Die Demokratisierung der Forschung

Themen wie Covid-19 oder die Klimakrise sind komplex und lassen sich nicht durch einfache Konzepte lösen. Regierungen und Wirtschaft hatten lange Zeit ein Monopol auf die Daten und die notwendigen Werkzeuge, um verschiedene Strategien bewerten zu können. Dies führt notwendigerweise zu Intransparenz, und gibt denjenigen, welche über die nötigen Prognose-Werkzeuge verfügen die Möglichkeit, Entscheidungen und Maßnahmen nach ihren politischen oder wirtschaftlichen Interessen auszurichten. Es entsteht ein Machtungleichgewicht.

Die Freigabe der Daten und der Einsatz von Citizen Data Journalists trägt dazu bei, dieses Missverhältnis auszugleichen. Dadurch, dass zahlreiche Berufe mittlerweile datenanalytische Fähigkeiten erfordern, ist genug Fachwissen aufseiten der Bürger vorhanden, die entstandenen Modelle notfalls auch durch kritischen Dialog zu verbessern.

Die Digitalisierung hat Daten zu einem wertvollen Rohstoff gemacht, und einen Bedarf an Fachleuten in ihrer Analyse geschaffen, der nun eine direkte Auswirkung auf den öffentlichen Diskurs hat. Datenanalyse ist spätestens seit dem Ausbruch der Covid-19-Pandemie ein unverzichtbares Werkzeug in der öffentlichen, demokratischen Diskussion.

"Das grundlegende Ziel solcher Modellrechnung ist dafür zu sorgen, dass sie nie so eintreten", sagt Dirk Paessler und er hofft darauf, dass unsere Gesellschaft aus diesen Modellen lernt, handelt und wir diese Infektionszahlen nicht erreichen werden. Der Einsatz von offenen Daten und fortschrittlichen Datenanalyse-Werkzeugen bietet eine Möglichkeit, auch die übrigen komplexen Probleme zu lösen, denen die Gesellschaft sich heute gegenübersehen.