Auf dem Blog von PANDA Uncut hat der Autor Thomas Verduyn eine umfangreiche Analyse zur Datenqualität des ersten und berühmtesten aller COVID-Dashboards mit vielen Quellennachweisen erstellt. Verduyn stellt dabei verblüffende Besonderheiten fest. Nachfolgend wird ein allgemeiner Überblick über die Ergebnisse seiner Untersuchung gegeben.
Einführung in die Pandemiedarstellung der Johns Hopkins Universität
Die Online-Präsentation der Johns Hopkins University (JHU) wurde unmittelbar nach dem Auftreten der ersten COVID-19-Fälle ins Leben gerufen und erlangte globale Bedeutung als zentrale Informationsquelle.
„Die neue Website [JHU-Dashboard] erregte in kürzester Zeit große Aufmerksamkeit und wurde schnell zur wichtigsten Datenseite für Medien, medizinische Forscher, Gesundheitsbehörden und die breite Öffentlichkeit.“ (Verduyn)
Entwicklung und schneller Start
Die bisher einmalige Art der digitalen Präsentation von Live-Daten, entwickelt von einem Team um Professor Lauren Gardner, ging innerhalb von wenigen Stunden online, eine Reaktionsgeschwindigkeit, die sowohl beeindruckend als auch problematisch war. Eine so schnelle Entwicklung und Implementierung stellte das Team vor die Herausforderung, in Echtzeit auf sich schnell ändernde globale Gesundheitsdaten zu reagieren.
„Ungeachtet dessen, was diese Fakten vermuten lassen, war das Dashboard zumindest nach eigener Aussage das Ergebnis einer ’spontanen‘ Entscheidung und wurde in ’nur wenigen Stunden‘ erstellt.“ (Verduyn)
Wozu ein Dashboard für COVID?
Der Analyst Verduyn weist auf die objektive Gefährdungslage wie folgt hin:
„In diesem ersten WHO-Bericht hieß es, dass „282 bestätigte Fälle von 2019-nCoV aus vier Ländern, darunter China, gemeldet wurden“. Außerhalb Chinas waren es insgesamt nur vier Fälle, und es hatte keine Todesfälle gegeben. Tatsächlich wurden bis zu diesem Zeitpunkt nur sechs Todesfälle offiziell mit dem Virus in Verbindung gebracht, und alle davon stammten aus Wuhan. Zum Vergleich: Schätzungen zufolge infizieren sich jedes Jahr 685 Millionen Menschen mit dem Norovirus und sterben 212.000 Menschen daran. Uns ist nicht bekannt, dass es irgendwo auf der Welt ein Norovirus-Dashboard gibt.“
Thomas Verduyn auf seinem Blog PANDA Uncut
Insofern sind die Motive, die zur Konzeption des JHU-Dashboards geführt haben, hinterfragenswert.
Quellenkritik und Datenbeschaffung
Das JHU-Dashboard begann mit einer zuverlässigen Quelle, erweiterte jedoch schon bald seine Datenquellen, um aktuellere Informationen zu bieten. Diese neuen Quellen umfassten Twitter-Feeds, Online-Nachrichtendienste und direkte Mitteilungen, die oft weniger verifiziert waren. Hier stellt sich schon für den Laien die Frage, wie seriös medizinische Meldungen aus Online-Medien sein können.
„Ursprünglich war die primäre Datenquelle DXY, eine von Mitgliedern der chinesischen medizinischen Gemeinschaft betriebene Online-Plattform. Später wurden andere Quellen hinzugezogen.“
Thomas Verduyn auf seinem Blog PANDA Uncut
Herausforderungen bei der Datenintegrität
Die Validierung und Integration der Daten stellten das Dashboard-Team vor große Herausforderungen. Probleme mit doppelten Daten und die Zuverlässigkeit der Informationen waren schwer zu kontrollieren. Dies unterstreicht die Schwierigkeiten, mit denen das Team konfrontiert war, um genaue und verlässliche Daten zu gewährleisten.
„Wenn Informationen aus mehr als einer Quelle stammen, kann es vorkommen, dass ein und dasselbe Ereignis doppelt gezählt wird.“
Thomas Verduyn auf seinem Blog PANDA Uncut
Der Einsatz von Computersimulationen
Es gibt starke Anzeichen dafür, dass das Dashboard nicht ausschließlich auf tatsächlichen Daten, sondern auch auf Computersimulationen basierte. Diese Methodik wirft Fragen zur Genauigkeit der präsentierten Informationen auf. Die Abhängigkeit von Modellen stellt die Authentizität der Daten weiter in Frage und hebt die Notwendigkeit hervor, solche Methoden transparent zu machen.
„Es ist sicher, dass das JHU-Team Computermodelle verwendet hat, um die Fall- und Todeszahlen zu ermitteln.“
Thomas Verduyn auf seinem Blog PANDA Uncut
Bewertung der Datenquelle und -qualität
Die Vielfalt der Datenquellen und die Geschwindigkeit ihrer Integration in das Dashboard führten bei Verduyn zu weiteren Bedenken hinsichtlich der Datenqualität. Auch andere Experten haben schon darauf hingewiesen, dass die schnelle Aggregation von Daten aus so unterschiedlichen und unüberprüften Quellen die Gefahr von Fehlinformationen erheblich erhöht.
Globale Auswirkungen und Reaktionen
Tatsächlich wurde das JHU-Dashboard sehr schnell zur Hauptreferenzquelle für weltweite COVID-19-Statistiken, was deren Einfluss auf öffentliche und politische Reaktionen verstärkte. Dies zeigt den enormen Einfluss, den es weltweit hatte, und es verdeutlicht auch die Verantwortung, die mit der Bereitstellung solcher Daten einhergeht.
„Innerhalb von zwei Monaten nach dem Start wurde die Website Berichten zufolge ’12 Milliarden Mal pro Tag aufgerufen’“.
Thomas Verduyn auf seinem Blog PANDA Uncut
RKI-Dashboard in Deutschland
Aufgrund der Popularität des JHU-Dashboards wurden in vielen Ländern solche Formen der Datenanalyse entwickelt. In Deutschland wurde dies vom Robert-Koch-Institut (RKI) entwickelt und betreut.
Der Verfasser hatte selbst schon im Juni 2020 sein erstes Video veröffentlicht, in dem er in leicht nachvollziehbarer Weise darlegte, dass die vom RKI veröffentlichten Datensätze weder vollständig noch logisch nachvollziehbar waren und daher grundsätzlich kritisch zu betrachten sind.
Bedarf an Transparenz und Verifikation
Das JHU-Dashboard illustriert die Macht und potenzielle Gefahr von Echtzeit-Informationsquellen. Die Analyse unterstreicht die Notwendigkeit, Daten immer kritisch zu hinterfragen und deren Quellen sorgfältig zu prüfen.
Transparente und überprüfbare Datenquellen sind entscheidend, um fundierte Entscheidungen in Krisenzeiten zu ermöglichen. Es ist essentiell, dass zukünftige Dashboards eine ausgewogene Mischung aus Schnelligkeit und Genauigkeit anstreben, um ihre Nützlichkeit und Zuverlässigkeit zu maximieren.
In der Welt der Datenerfassung und -analyse ist ein sorgfältiger Umgang mit Quellen und Methoden unerlässlich, um die Integrität der daraus resultierenden Entscheidungsgrundlagen zu gewährleisten. Ohne diese Sorgfalt ist weder eine Beurteilung der Sachlage noch eine Handlungsstrategie auf einer wissenschaftlichen Grundlage möglich, sodass der willkürlichen Interpretation freien Lauf gelassen wird.
(Ein Beitrag von Uwe Loose)