CoronaVirus: Landkreise brauchen nun Aufmerksamkeit
Wir haben die Ansteckungsdaten anschaulich und tagesaktuell für Landkreise und Bundesländer mit Inzidenz, Prävalenz, Erwartungstag und Reproduktionsfaktor aufbereitet
Seit Covid19 waren Welt- und Europa-Ebene wohl einfach zu groß. Sogar die Koordination auf Bundesebene wurde nun zurückgefahren zugunsten der Bundesländer. Es ist aber immer schon die Kreis-Ebene, auf der Intensivstationen voll oder leer beispielsweise für Rettungswagen-Ärzte erscheinen.
Wenn Ihr Landkreis über 14 Tage hinweg null Neu-Ansteckungen hatte, dann können Sie wirklich erst einmal aufatmen. Die neue Website cov19de richtet ihren Fokus auf diese Ebene. 401 Landkreise, jeder einzelne in viele Dimensionen aufgeschlüsselt - und der Python-Code wächst täglich weiter. Was Sie natürlich nun am meisten interessieren sollte, ist Ihr eigenes Zuhause oder das von Familienangehörigen. Am einfachsten geht das, wenn Sie auf der Deutschland-Übersicht Volltextsuche ("find text in page") gehen und z.B. "Heinsberg" eintippen.
Den Funktionalitäten der Site nähert sich dieser Text via "Sensationalisierung" - mit Fokus auf besonders hart getroffene oder gefährdete Landkreise und Bundesländer. Wie ist die Lage? Was wir nun brauchen, sind mehrere Kennzahlen. Reproduktionszahl, Inzidenz (neue Fälle pro Bevölkerung), und vielleicht ein Maß für das Helikopterbild: Ein simpler erster Kandidat dafür ist der "Erwartungs-Tag". Bitte schlagen Sie gern weitere Messgrößen vor, die implementiert und ausprobiert werden können.
Notbremse: wöchentliche Inzidenz - tagesaktuell
Beginnen wir mit Inzidenz, und der 'Corona-Notbremse' von 500 neuen Fällen pro Million Einwohner in 1 Woche.
Aktualisierte Daten hier: Greiz, Rosenheim,
Erklärungen zu den Plots (Bild 1)
- Die rosa-gestrichelte Linie: Hier tritt der Bundesnotfall von "mehr als 500 wöchentliche Fälle pro Million Einwohner" ein. Die Linie liegt also auf von Bevölkerungsanzahl abhängiger Höhe von 71.4 neuen Fälle pro Tag pro Million Einwohner. Wenn diese Grenze 7 Tage lang gemittelt überschritten wurde, folgen strengere Maßnahmen - und der Bund eilt zu Hilfe? (Jetzt schon diskutieren einige Bundes-Länder, selbst bei 300 oder 350 einen eigenen Grenzwert einzuziehen, damit idealerweise der Bundesnotfall gar nicht getriggert werden wird.)
- Die graue zappelige Linie sind die berichteten Fälle pro Tag; geglättet über 7 Tage (lila) oder 14 Tage (orange), als gleitende, ungewichtete, zentrierte Mittelwerte.
- Der grüne Balken ist der "Erwartungstag" oder "Mitteltag", Erklärungen weiter unten in diesem Text. Kurz gesagt: Wenn Sie einen zufälligen Fall aus diesem Landkreis treffen, ist jener Tag Ihre beste Schätzung, wann er gemeldet wurde.
- Die blaue Linie sind alle bisherigen Fälle kumuliert. Wir wollen, dass sie eine S-Kurve wird - wovon aber sowohl Greiz wie Rosenheim noch weit entfernt sind.
Erklärungen zu den Tabellen
- 7 Tage neue Fälle - die wichtigste Zahl hier: Wie groß ist der aktuelle Ausbruch? Da allerdings Landkreise & Städte sehr verschieden groß sind, verwandeln wir das durch Division in:
- 7 Tage Inzidenz pro 1 Million Einwohner. Die Annahme ist hier, dass die Möglichkeiten von Gesundheitsämtern und Krankenhäusern in diesem Kreis proportional zur Bevölkerungszahl skalieren. Zu simpel? Ja bestimmt - aber in erster Näherung passt es. Die Tabelle ist nach jener Spalte absteigend sortiert.
- Prävalenz ist Gesamtfälle pro 1 Million Einwohner, also proportional zum letzten Datenpunkt der blauen Linie im Plot. (Vielleicht wollen Sie die obige 7 Tage Inzidenz mit dieser Prävalenz vergleichen, um ein Gefühl dafür zu bekommen, wie die relative Größe des Neu-Ausbruchs in diesem Landkreis ist)
- Erwartungstag "Center Day" und Reproduktionszahl R~Reff,4,7 sind unten ausführlicher erklärt.
Zusammenfassend: Mindestens hilfebedürtig sind: Greiz, Rosenheim, Coesfeld, weil sie in der Wochensumme auf über 500 Fälle pro eine Million Einwohner kamen. Aber jeder Grenzwert hat seine Grenzen - also sind in Bild 1 auch noch sechs andere Kreise erwähnt, die am 7.5.2020 alle mehr als 300 neue Fälle pro 1 Million Einwohner hatten.
Interessant ist übrigens auch, sich einmal viele andere Landkreise anzuschauen. Es sind gar nicht wenige, die im gesamten Infektions-Geschehen der vergangenen 2 Monate immer unter jenem "Grenzwert" blieben.
Bundesländer ...
Alle Zahlen in den Kreisen zu akkumulieren führt uns auf die nächsthöhere Ebene, hier sind besonders 3 Bundesländer relevant, weil ihre Inzidenz immer noch recht hoch ist.
Aktualisierte Daten: Deutschland.html#Bundeslaender
... und die Zeitreihen Heatmap
Was hier nun zusätzlich zu sehen ist, ist die Heatmap-Einfärbung der gesamten Zeitreihe mittels der täglichen Neufälle; eine Darstellung inspiriert durch TomasPueyo ("The Hammer and the Dance" Autor) in seinem dritten Text "Coronavirus: Learning How to Dance" --> chart 3 Er schaut nicht auf relative Fälle (pro Bevölkerung), sondern nimmt absolute Zahlen: "What I'm judging is the likelihood that the outbreak is controlled or not. Outbreaks have absolute dynamics: wherever you are, 20 cases a single day might be ok, but 2000 is not. In one case you are in control, in the other you aren’t. That’s why absolutes matter to me here." (personal communication, April 11th).
Diese absoluten Zahlen aber werden innerhalb einer Region verglichen mit der gesamten Zeitreihe, und entsprechend eingefärbt - Null ist Grün, das zeilenweise Maximum ist Rot. Wegen Meldeverzug und sehr "zappeligen" Daten (siehe graue Kurven) wurden die täglichen Zuwächse zunächst mit einem zentrierten 3-Tage-Fenster geglättet, und dann erst die Zellen mit dem Ergebnis gefärbt. Woraus sich auch ergibt, warum die Rand-Datums-Spalten jeweils keine Färbung haben können.
Bundesländer-Vergleich, der Länder mit Wochen-Inzidenz > 100 pro Million Einwohner
Bayern hatte pro Million Einwohner insgesamt 2-3 mal mehr Fälle als Bremen und Thüringen (Prävalenz).
Bayerns Ausbruch ist aber augenscheinlich bereits deutlich besser unter Kontrolle als in den beiden anderen Ländern - die roten Zellen in der Tabelle sind "viel weiter links", was sich auch in einem um 6 Tage früheren "Center Day" (siehe unten) niederschlägt.
(Wenn auch die absolute Anzahl von Fällen bloß bei 20 pro Tag liegt, ist) ist die 7 Tage Inzidenz in Bremen noch doppelt so hoch wie in Thüringen oder Bayern - obendrein scheint sich dort die Kurve noch nicht wirklich abzuflachen. Was uns zum nächsten Maß bringt:
Reproduktionszahl Schätzung
Der exzellente heise-Artikel von Andreas Stiller fasst sehr gut zusammen, was getan wird, um auf der Basis von empirischen Daten die Reproduktionszahl (ein Infizierter steckt im Mittel wie viele weitere an?) zu schätzen: "Die Mathematik hinter den Reproduktionszahlen R."
Abwandlung: cov19de liegen derzeit nicht die RKI Daten zugrunde, sondern die crowdgesourcten 401 Landkreise mit den Daten von RiskLayer.com aus Karlsruhe. Auch weil die ohne zurückliegendes Erkrankungsdatum sind, entfällt hier jegliches "Nowcasting". Im Gegensatz zu dem 4-Tage-Glättungsfenster des RKI, das bei unseren Daten zu einer (schwer interpretierbaren) Wellenbewegung von R führen würde, wird bei cov19de stattdessen erst über 7 Tage gemittelt, bevor der Reproduktionsfaktor dann allerdings genauso wie am RKI auch per Quotient aus N(t) und N(t-4) bestimmt wird.
Wenn Sie Details interessieren, dieser Tweet zeigt den simplen Python-Code. In obigem Bild 2 ist das Nicht-Abflachen der Kurve in Bremen durch ein hohes R zu erkennen.
Aktualisierung: Deutschland.html#Kreise und Klick auf Spaltenkopf - und Geduld.
Warnungen:
- Wegen des Quotienten zu einem 4 Tage zurückliegenden Mittelwert ist die Reproduktionszahl in den allerersten Tagen eines Neuausbruchs nicht berechenbar. Sie werden teilweise in jener Spalte ein "nan" (not-a-number) sehen.
- Bei kleinen Grundgesamtheiten (z.B. kleinen Kreisen mit nur einer Handvoll Fälle) wird die R-Schätzung auch mal zu extrem erscheinenden Zahlen führen.
- Vergessen Sie nicht, dass wenn die Datenbasis behauptet, es gäbe innerhalb eines Tages plötzlich statt 0 Neuansteckungen nun 50 Neuansteckungen, die in Wirklichkeit vermutlich dann aber über mehrere Tage passiert sind, aber z.B. ein Wochenende sie alle in einen Tag presste.
- Es ist eine Schätzung. Nicht mehr und nicht weniger.
Trotz alledem: Landkreise, die man sich derzeit vielleicht näher anschauen sollte sind: Steinburg in Schleswig-Holstein, Coesfeld in NRW und Regensburg und Eichstätt in Bayern. Aber ... tägliche Aktualisierung ist natürlich auch hier wichtig, also:
Spaltensortierung
Öffnen Sie einmal die 401-Landkreise-Tabelle Deutschland.html#Kreise. Durch Klick auf eine Spaltenüberschrift wird die Tabelle sortiert (erst absteigend, durch zweiten Klick aufsteigend). Die lange 401-Kreise-Tabelle in JavaScript zu sortieren, dauert ~30 Sekunden, solange der Spaltenkopf gelb leuchtet, bitte einfach Geduld. JavaScript muss aktiviert sein.
Sie können sich nun fragen: Welche Landkreise sind HEUTE weit weg von ihrem "flatten the curve"-Ziel? Sortiere nach Reff_4_7 - und schauen dann auf die 7-Tage-Inzidenz.
Erwartungstag / CenterDay
Tomas Pueyos gefärbte Tabelle ermöglicht uns nun auch, einmal das ganze Land zu betrachten. Um zeilenweise eine gute Sortierung zu erreichen, berechnen wir aus der gesamten Zeitreihe einer Region (der bunten Tabellenzeile) einen einzelnen Wert, nach dem dann sortiert werden kann.
Unser erster Versuch dafür ist die Produktsumme aus den täglichen Neuansteckungen und dem Tagesindex, geteilt durch die Gesamtfälle. Das führt zu einem "Center Day", oder "Erwartungstag" = Wenn ich einem zufälligen Fall aus einer Region begegne, ist dieser Tag die beste Schätzung, WANN er seinen Weg in die Statistiken fand. Es ist also ein mittlerer Tag, gewichtet mit der Anzahl der täglichen Fälle. Alle 401 Kreise in diese Reihenfolge gebracht, ergibt diese riesige Grafik - zoomen Sie so, dass Sie die gesamte Grafik auf dem Bildschirm überblicken können:
Erkennen Sie die leichte Tendenz "unten = links, oben = rechts"? Genau - die Gegenden, die es "erst mal hinter sich haben", sind ganz weit unten in der Tabelle. Kein Wunder also, dass z.B. Heinsberg hier fast auf dem letzten Platz sitzt. Die oberen 10-20 Landkreise dagegen haben kürzlich erst ihre größten Dramen erlebt. Die Extreme in Zahlen sind übrigens 26 Tage - das "wer war früher oder später dran mit Covid19?" liegt also in Deutschland weit mehr als drei Wochen auseinander!
Ausblick
Die Site ist online und neue Grafiken und Tabellen werden nächtlich gegen 02:00 Uhr aktualisiert, weil die unterliegenden RiskLayer Daten gegen Mitternacht endgültig sind. Solange jenes Crowdsourcing Projekt am KIT in Karlsruhe weitermacht, ist es also leicht, diese tagesaktuellen Übersichten zu erhalten.
Es gibt eine Liste von Plänen, was noch implementiert werden wird. Bitte gern mehr Ideen produzieren. Querverlinkungen mit anderen Projekten sind geplant. Bitte gern Hinweise.
Damit es Motivation gibt weiterzumachen, ist das, was am dringendsten gebraucht wird, aber ... Nutzer. Bitte um Reichweite. Bitte gern Auswertungen, Screenshots, etc. verbreiten - unter dem Hashtag #cov19de, damit sie bemerkt werden. Danke. Dort sind auch fertige Tweets (Englisch und Deutsch), gern retweeten. Danke. Eine erste Version ist bereit für Besucheransturm - sehr gespannt, welche Verbesserungs-Vorschläge nun kommen werden
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmmung wird hier eine externe Buchempfehlung (Amazon Affiliates) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Amazon Affiliates) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.