Die Corona-Warn-App: Ein 220-Millionen-€-Flopp, der die Meldeinzidenz erhöht
Zusammenfassung
Die Daten zur Nutzung der Corona-Warn-App (CWA) legen nahe, dass die App nicht zur Unterbrechung von Infektionsketten beigetragen hat, sondern im Gegenteil die Meldeinzidenz getrieben hat. Mehr Warnungen führten zu einem prozentuellen Anstieg der Meldeinzidenz in der kommenden Woche.
Downloads der App
Die Corona-Warn-App (CWA) wurde eingeführt, um Infektionsketten zu unterbrechen. Es liegen die Daten über die Anzahl der Downloads und der Warnungen durch die App vor (https://www.coronawarn.app/de/analysis/, alle Daten von dort).
Mit diesen Daten lässt sich ein Überblick über den Nutzen der App generieren. Betrachten wir zunächst die Downloadzahlen.
Insgesamt wurde die App 48.4 millionenmal heruntergeladen. Über den Zeitverlauf sieht das so aus:
Man sieht, dass großer Teil der Downloads gleich zu Anfang an geschehen ist. In den ersten Tagen (bis zum 18.06.2020) wurde die App bereits über 10 millionenmal heruntergeladen. Bei den späteren Downloads ist zu bedenken, dass die selbe Person die App über die Zeit eventuell mehrfach herunterläd, zum Beispiel durch einen Wechsel des Smartphones bedingt.
Um den Zeitverlauf auch nach dem fulminaten Beginn einschätzen zu können, kann man die Daten auf logarithmisieren. Die Abbildung zeigt jetzt die Y-Achse als Zehnerpotenzen:
Im Durchschnitt wurde die App ca. 48 tausendmal am Tag heruntergeladen.
Warnungen über die App
Nun können wir die roten Warnungen betrachten, die über die App vermittelt wurden. Dabei ist wichtig zu bedenken, dass nicht alle Warnungen erfasst werden, sondern nur eine freiwillige Datenspende. Dieses Feature war seit Version 1.13 (6. März 2021) integriert (https://www.bundesregierung.de/breg-de/themen/coronavirus/corona-warn-app-update-1-13-1873182).
Wir betrachten zuerst die Korrelation zwischen den “Roten Warnungen” und den gemeldeten Corona-Fällen am Tag.
Es gibt eine sehr deutliche Korrelation (Pearson-Koeffizient: 0.77) zwischen der Meldeinzidenz und den Warnmeldungen. Das zeigt, dass die Datenspende relativ gut funktioniert hat. Steigen die Zahlen der Infektionen, dann werden auch mehr rote Warnungen verschickt.
Aber hatten diese Warnungen einen Beitrag zur Senkung der Infektionen in der Zukunft? Ein einfaches Modell, um dies zu testen, kann die 7-Tage-Inzidenz der kommenden Woche mit der Anzahl der durchschnittlichen Warnungen in der aktuellen Woche vergleichen. Es ist dabei aus mehreren Gründen wichtig, diese Daten noch zu skalieren. Erstens wissen wir, dass es saisonale Trends gibt. Wenn das Infektionsgeschehen insgesamt über mehrere Wochen steigt oder fällt, dann würden diese Trends die Analyse verfälschen. Zweitens reicht es nicht aus, auf absolute Zahlen zu schauen, weil die Unterbrechung einer InfektionsKETTE per Definition viele Infektionen verhindert. Eine gängige Transformation, um zu schauen, ob die eine Variable die andere beeinflusst, ist die Betrachtung der prozentuellen Unterschiede. Wenn an einem Tag der Wochendurchschnitt der Meldungen (oder Warnungen) bei 100 lag und am nächsten bei 120, hätten wir also einen prozentuellen Zuwachs von 20% oder 0.2. Ein Rückgang 100 auf 80 wäre parallel dazu eine prozentuelle Veränderung von -0.2. Ein Nachteil dieser Skalierung besteht darin, dass prozentuelle Veränderungen bei niedrigen absoluten Zahlen stark schwanken. Wenn wir einen Wechsel von 10 auf 20 sehen, wäre das schon eine Veränderung um 100%.
Die folgende Analyse vergleicht die prozentuellen Veränderungen des 7-Tage-Durchschnitts der roten Warnungen mit der 7-Tage-Inzidenz der kommenden Woche.
Auch wenn die Punktwolke zunächst sehr zufällig aussieht, gibt es eine deutliche Korrelation, die sehr signifikant ist (p-Wert < 2e-16). Allerdings ist der Effekt positiv! Wurden 10% mehr Warnungen im Durchschnitt versendet, stieg die Meldeinzidenz um ca. 2%.
Eine der Binsenweisheiten, die im Zuge der Analyse der Covid-Pandemie immer bemüht wird, wenn ein Ergebnis ein kritisches Licht auf die Maßnahmen wirft ist: “Korrelation ist nicht Kausalität!”.
Die Crux mit der Meldeinzidenz
Das ist natürlich richtig. Aber erstens ist festzuhalten, dass die Daten in diesem Fall einen umgekehrten Effekt ausschließen: Die Infektionen in der kommenden Woche können ja nicht die Meldungen in dieser Woche beeinflussen. Zweitens gibt es eine plausible Theorie, die den beobachteten Effekt sinnvoll erklärt. Der Schlüssel liegt in der Differenz von Prävalenz (also wie viele Personen tatsächlich infiziert sind) und der MELDEinzidenz. Es ist einer der gravierendsten Fehler der gesamten Pandemiebetrachtung, dass die RKI-Zahlen, die sich auf Testergebnisse stützen, als Inzidenz genommen werden. Die Vielzahl der Fehler die in diesem Gedanken stecken, habe ich an anderer Stellle bereits 2020 ausführlich diskutiert (https://politicaldatascience.blogspot.com/2020/11/der-gro-test-warum-eine-politik-die.html).
An dieser Stelle sei nur an ein paar zentrale Punkte erinnert. Wir können uns fragen, wie hoch die Meldeinzidenz ist, wenn sich niemand mehr testen lässt. Die Antwort ist natürlich Null. Umgekehrt können wir uns vorstellen, dass wir ein Komplettscreaning der Bevölkerung durchführen, also alle Personen werden getestet. Wie hoch dann die Inzidenz wäre, läge an zwei Faktoren. Erstens, wie viele Leute tatsächlich erkrankt sind, also die Prävalenz. Zweitens hängt die Inzidenz aber auch an der Zuverlässigkeit der Tests (Hier würde man normalerweise zwischen Sensitivität und Spezifität unterscheiden. Zur Verdeutlichung tun wir so, als wären diese Werte gleich.) Nehmen wir an, der Test ist in 99.9% der Fälle korrekt. Bei einer Prävalenz von 800.000 von 80.000.000 Personen (1% der Bevölkerung ist infiziert) würde der Test von den 800.000 echten Fällen 799.200 Fälle finden. Aber von den 79,2 Millionen Nichtinfizierten wäre der Test bei 79.200 Personen auch positiv. Die Inzidenz läge also bei 878.400 (oder 1,1 %), also höher als die Prävalenz. Eine Testgenauigkeit von 99.9 % ist noch dazu völlig ilusorisch. Die Tests wurden zum Teil von ungeschultem Personal in umfunktionierten Nachtclubs durchgeführt und sicher nicht unter Laborbedingungen. (Weitere Punkte, die zur Ungenauigkeit führen, siehe oben verlinkter Artikel.)
Gehen wir davon aus, dass jemand, der eine rote Warnung bekommt, sich eher testen lässt, dann ist es logisch, dass die Inzidenz steigt, einfach weil mehr getestet wird. Wenn es sich bei den positivgetesteten Personen aber um tatsächlich Infizierte handelt, dann sollte die Inzidenz in der Zukunft eigentlich sinken, da ja durch Quarantäne die Infektionsketten unterbrochen werden. Jetzt können wir uns noch fragen, wie wahrscheinlich es ist, dass jemand, der eine rote Warnung bekommt, tatsächlich infiziert ist.
Die CWA erfasst keine Infektionsketten, sondern speichert, welche anderen Geräte mit laufender CWA im Bereich der Bluetooth-Nearfield-Kommunikation für länger als 10 Minuten waren. Wenn ich also jemanden draußen treffe, und fünf Meter Abstand halte, dann werden unsere Kontakte ausgetauscht (übrigens auch völlig unabhängig davon, ob zum Beispiel Masken getragen wurden ;-)). Wenn ich den ganzen Abend mit einer Person verbringe, aber mein Handy ausschalte, wird der Kontakt natürlich nicht gespeichert. Es wäre völlig abstrus, von einer solchen Technik eine hohe Genauigkeit zu erwarten. Da die Prävalenz zu keinem Zeitpunkt auch nur annähernd in der Nähe von 50% gewesen sein kann, ist auf jeden Fall ein Großteil der gespeicherten Kontakte nicht infiziert. In der Pandemie sahen wir R-Werte von deutlich unter 2. D. h., jede Person hat im Durchschnitt also weniger als zwei weitere Personen angesteckt… von allen Kontakten! Führt man sich diese einfachen Überlegungen vor Augen, dann ist es völlig plausibel, dass die Anzahl der falsch-positiven PCR-Tests, die dann in die Meldeinzidenz eingehen, wesentlich höher ist, als der Effekt, der durch die Unterbrechung einzelner Infektionsketten zustande kam.
Das heißt also nicht, dass die App nicht eventuell auch Infektionen verhindert hat. Sie hat aber auf jeden Fall nicht zu einem Absenken der Meldeinzidenz geführt: Im Gegenteil.
Eine rote Warnung auf der App geht mit einem individuellen und gesellschaftlichen Schaden einher. Wer eine rote Warnung hat, macht sich Sorgen und sich oder anderen eventuell Vorwürfe, stellt seine Tätigkeiten ein, warnt andere (über die App und privat), die sich ebenfalls Sorgen machen und in der Summe nimmt die Zahl der anlasslosen Tests (ohne Symptome) zu, die medizinisch keinen Nutzen haben, aber falsch-positive Ergebnisse beinhalten. Gleichzeitig ermuntert die steigende Meldeinzidenz die Politiker zu neuen Maßnahmen, die sich im Nachhinein als wenig nützlich erwiesen haben.
Die 220 Millionen Euro hätte man sinnvoller investieren können.
Der Glaube, an die Nützlichkeit der CWA sollte in einem größeren theoretischen Kontext betrachtet werden. Ich habe dies an anderer Stelle unter dem Stichwort “Nutzerismus” versucht (https://politicaldatascience.blogspot.com/2022/09/der-nutzerismus-eine-ideologie-mit.html).