Corona Datenanalyse: Länder im Vergleich

Datenquelle

Zunächst einmal: die zuvor zitierte Datenquelle auf Google Docs wird offensichtlich nicht mehr gepflegt. Dafür sind Daten hier verfügbar – dankenswerterweise über einen einfachen Download-Klick. Den Datensätzen für Taiwan fehlt allerdings das Anführungszeichen vor dem Wort „Taiwan“ (es steht also nur Taiwan“ in der Datei). Das Problem beheben wir wieder manuell und lesen die Datei mit R ein, indem wir das Anführungszeichen durch einen * ersetzen, so wie unten beschrieben.

Länder im Vergleich

Wir wollen heute Länder im Vergleich betrachten. Ausgewählt sind hier China, Deutschland, Italien, Singapur, Spanien und die Vereinigten Staaten. In logarithmischer Auftragung haben kleine Unterschiede eine große Bedeutung. Spanien, Deutschland und die USA bilden nahezu eine Gruppe, die Italien im Abstand von etwa einer Woche folgen.

Um es deutlich zu sagen: wenn wir in Deutschland wissen wollen, was in einer Woche bei uns los ist, dann müssen wir weiterhin nach Italien gucken.

Bei genauerer Betrachtung fällt auf, dass die Kurven für die USA und Spanien in etwa die selbe Steigung aufweisen, wohingegen die für Deutschland und Italien etwas abgeflacht erscheinen. Ich habe nicht geprüft, ob das statistisch signifikant ist. Wir sehen auf alle Fälle in all diesen vier Ländern den typischen „Weckruf“ in den Daten, den plötzlichen „Sprung“ zu einem bestimmten Zeitpunkt, ab dem Daten systematisch erfasst wurden und die bestätigten Fälle scheinbar sprunghaft ansteigen.

Spezialfall Singapur

Völlig überraschend ist hingegen die Kurve für Singapur: man hat offensichtlich schon sehr früh, also bei wenigen bestätigten Corona-Fällen, ein gutes Messsystem eingeführt, denn es fehlt der „Weckruf“. Zudem verläuft die Kurve deutlich flacher. Das macht Hoffnung, denn die Maßnahmen, die Singapur schon sehr früh eingeführt hat, sind inzwischen auch in Europa größtenteils umgesetzt. Allerdings ist die Schlacht auch in Singapur alles andere als gewonnen, wie wir bei einer Detailbetrachtung sehen:

Wir erkennen einen Wendepunkt Mitte Februar (grün hervorgehoben) – aber dann ein erneutes Aufflammen Anfang März (rot). Eine Regressionsanalyse zeigt, dass für die Zeit zwischen diesen beiden Zeitpunkten die Rate der „Confirmed Cases“ sich über etwa 30 Tage verdoppelt hätte (bei R^2 = 96%), wohingegen inzwischen wieder mit einer Verdopplung über 10 Tage gerechnet werden muss. Es besteht zu hoffen, dass sich die Rate für Deutschland diesen Werten schnell annähert, wo wir weiterhin mit einer Verdopplung alle 2,5 Tage zu kämpfen habe (R^2 = 99%).

„Hausaufgaben“ für heute

Sehen wir auch für Italien solch einen „Knick“ wie für Singapur? Ist der signifikant?
Wählen Sie eigene Länder für einen Vergleich aus und erzeugen Sie die obige Graphik.