Was kann Data Science tun, um Pandemien in Zukunft zu verhindern?
Veröffentlicht: 2020-05-19Wir sind derzeit mit einem weltweiten Notfall konfrontiert. Aus Sicht der öffentlichen Gesundheit müssen Behörden zur Bekämpfung einer Epidemie verschiedene Maßnahmen ergreifen, z. B. die Schaffung eines wirksamen Bewusstseins, die Festlegung von Richtlinien für Gesundheitsexperten, die Bekämpfung von Kontaminationsclustern, die Begrenzung der Bevölkerungsentwicklung und die Zuweisung knapper Ressourcen.
Eine schnelle und genaue Datenanalyse, die Ausbrüche lokalisieren und Bewegungen vorhersehen kann, ist entscheidend für die Bekämpfung unwiderstehlicher Infektionen. Historische Methoden wie Untersuchungsberichte und Krankenhausaufzeichnungen sind zuverlässig, aber bestenfalls mäßig in der Prognose. Es wächst die Überzeugung, dass aktuellere Methoden, einschließlich Handy-Tracking und Data Mining von Suchmaschinen und sozialen Medien, dazu beitragen können, ein schnelleres und zunehmend verfeinertes Bild davon zu vermitteln, wo sich Krankheiten entwickeln und wo sie sich als nächstes ausbreiten könnten.
Die Datenwissenschaft kann eine wichtige Rolle bei der Aufschlüsselung der groß angelegten Tests von Einzelpersonen spielen, indem sie diese Ergebnisse mit den anonymisierten Gesundheitsattributen von Krankenhauspatienten verbindet. Dies würde es uns ermöglichen, die wichtigsten Risikofaktoren zu verstehen und Personen mit dem höchsten Infektionsrisiko besser zu schützen. Je mehr Informationen vorhanden sind, desto genauer könnten diese Vorhersagen sein.
Inhaltsverzeichnis
Macht der Vorhersage
Die Innovation der Vorhersage hat in den letzten 20 Jahren zahlreiche Unternehmen verändert. Organisationen wie BlueDot und Metabiota verwenden eine Reihe von Algorithmen zur Verarbeitung natürlicher Sprache (NLP), um Nachrichtenagenturen und offizielle Gesundheitsberichte in verschiedenen Sprachen auf der ganzen Welt zu überprüfen. Ihre Vorhersagegeräte können sich ebenfalls auf Flugreiseinformationen stützen, um das Risiko zu ermitteln, dass an Transitknotenpunkten kontaminierte Personen entweder auftauchen oder abreisen.
Unter Verwendung verschiedener Big-Data-Quellen könnten Modelle für maschinelles Lernen trainiert werden, um das klinische Risiko einer Person zu quantifizieren, eine schwere Krankheit zu entwickeln, wenn sie sich eine schwere Infektion wie COVID-19 zuzieht: Wie hoch ist die Wahrscheinlichkeit, dass sie eine spezialisierte Behandlung benötigen würde, für welche Vermögenswerte sind begrenzt? Wie wahrscheinlich ist es, dass sie der Krankheit erliegen? Solche Daten könnten die grundlegenden Krankengeschichten der Menschen enthalten.
Die Ergebnisse sind ziemlich genau. Beispielsweise ging Metabiotas jüngster öffentlicher Bericht vom 25. Februar davon aus, dass es am 3. März weltweit insgesamt 1.27.000 COVID-19-Fälle geben würde. Diese Zahl wurde um rund 30.000 überschritten, aber Mark Gallivan, der damalige Director of Data Science des Unternehmens, sagte, dass dies noch im Fehlerbereich sei. Außerdem wurden die Nationen erfasst, die am wahrscheinlichsten neue Fälle melden, darunter China, Italien, Iran und die Vereinigten Staaten von Amerika.
Das DeepMind-KI-System von Google wird verwendet, um die Attribute des Virus zu unterscheiden, was helfen kann, seine Funktionsweise zu verstehen. Diese Daten würden sich als hilfreich erweisen, um zu bestimmen, welche Medikamente zu suchen sind. Andere haben die vom britischen Bioinformatik-Startup BenevolentAI entwickelte Technologie integriert, die künstliche Intelligenz nutzt, um vielversprechende bestehende Behandlungen für verschiedene Krankheiten zu finden, die bei der Behandlung von COVID-19 wirksam sein könnten.
Chinas Einsatz der Gesichtserkennungstechnologie und Temperaturerkennungssoftware von SenseTime zur Erkennung von Personen, die möglicherweise Fieber haben und möglicherweise die Infektion haben, hat ebenfalls geholfen. Eine ähnliche Innovation treibt die "intelligenten Helme" an, die von den Behörden im Gebiet von Sichuan verwendet werden, um Personen mit Fieber zu erkennen.
Die chinesische Regierung hat außerdem ein Überwachungssystem namens Health Code aufgebaut, das Big Data verwendet, um das Risiko jeder Person in Abhängigkeit von ihrer Reisegeschichte, der Zeit, die sie an Infektions-Hotspots verbracht haben, und der potenziellen Exposition gegenüber Personen mit dem Virus zu identifizieren und zu bewerten . Den Einwohnern wird ein Farbcode (rot, gelb oder grün) zugewiesen, den sie über die Mainstream-Anwendungen WeChat oder AliPay erhalten können, um anzuzeigen, ob sie isoliert oder in die Öffentlichkeit gehen dürfen.
Im Gegensatz zu medizinischen Tests, die selten und kostspielig sind und oft mit Verzögerungen geliefert werden, kann dieser auf klinischen Daten basierende digitale Personalisierungsansatz schnell angewendet werden und ist recht einfach zu skalieren. Es würde eine bessere und attraktivere Vermögensallokation bei seltenen medizinischen Geräten ermöglichen, zum Beispiel Testeinheiten, Schutzmasken und Krankenhausbetten.
Es könnte uns die richtigen Modelle an die Hand geben und eine sicherere De-Quarantäne viel schneller ermöglichen, als es die aktuellen Best Practices für COVID-19 mit getrennten Teststrecken zulassen, bei denen alle Infizierten und ihre Kontakte unabhängig davon in Haft bleiben würden ob sie im Allgemeinen sicher sind oder Symptome einer schweren Krankheit zeigen.
Mining für Daten
Die Informationen zur menschlichen Mobilität und Telekommunikationsdaten, die während des Ebola-Ausbruchs in Westafrika verwendet und zusätzlich vom UNICEF Innovation Lab, Flowminder und anderen Organisationen untersucht wurden. Das zugrunde liegende Hauptziel besteht darin, die Trends der menschlichen Mobilität in Bezug auf Sperrmaßnahmen zu verstehen und die Gefahr des Fortschreitens von Krankheiten in einer bestimmten Region einzuschätzen.
Am Boden kann diese Krankheit durch die Verwendung einer Anwendung von EPI Info Viral Hemorrhagic Fever kontrolliert werden, einem Open-Source-Programm, das diejenigen identifiziert, die Viren ausgesetzt sind, und eine riesige Datenbank mit Patientendaten erstellt, die Name, Geschlecht, Alter, Ort und medizinische Daten enthält Geschichte und zahlreiche andere Identifikatoren.

Bei der Anwendung von Big-Data-Analysen nutzte der schwedische Firmenname Flowminder Telefonaufzeichnungen aus dem Jahr 2013 im Senegal, um vergangene Infektionsausbrüche mit Verkehrsmustern zu überlagern, um die Bewegung und das Wachstum von Ebola innerhalb des Landes vorherzusagen. Während ein erheblicher Teil der Reaktion auf Ebola in der physischen Infrastruktur und im Betrieb angesiedelt ist, ist es klar, dass die Reaktion durch die Fähigkeit zur Nutzung von Daten ergänzt wird.
Ein zweiter ermutigender Weg ist das Data Mining von Social Media- und Suchmaschinenaktivitäten, die schnell zeigen können, wo ein Ausbruch stattfindet. Daten aus Social Sharing und Suchmaschinenabfragen können jedoch irreführend sein und sollten nicht ausschließlich vertrauenswürdig sein. Stattdessen konsolidieren Gesundheitsorganisationen Informationen aus diesen Quellen mit traditionellen medizinischen Datensätzen und nutzen medizinische Fähigkeiten, um Trends zu analysieren. Daniel Bausch , der Direktor des UK Public Health Rapid Support Teams , sieht ein unglaubliches Potenzial in den aus den sozialen Medien gesammelten Datensätzen.
Kürzlich hat das Big Data Laboratory des Projektbüros für Entwicklungsstrategie in Nischni Nowgorod ein mathematisches Modell entwickelt, um die Ausbreitung von COVID-19 vorherzusagen. Das Modell verwendete die Informationen zu den meisten Nationen und Bezirken, die Erkenntnisse zu COVID-19 veröffentlicht haben, darunter 297 Regionen der Welt und 21 Gebiete in Italien.
Das Team beobachtete kontinuierlich die russische und globale Forschung zu COVID-19. Dies impliziert, dass sie die Informationen für das Modell von überall auf der Welt sammeln könnten, sowohl nach Nationen aggregiert als auch nach Regionen und kleineren Territorien verteilt. Die Analyse umfasste einige Dutzend städtische Städte, um diejenigen zu unterscheiden, deren epidemiologische Parameter ihren eigenen am nächsten kommen (Politik, Bevölkerungsgröße und -dichte). Das so entwickelte Modell hilft, die Pandemie mit einer Genauigkeit von 2,5 % vorherzusagen.
Ein Ansatz ist die Einrichtung unabhängiger Ethikausschüsse oder Datentreuhänder. Ihre Aufgabe wäre es, Data-Governance-Mechanismen zu schaffen, um die Harmonie zwischen widerstreitenden öffentlichen Interessen zu entdecken und gleichzeitig die individuelle Sicherheit zu gewährleisten.
Lesen Sie auch: Produktive Dinge, die im Lockdown zu tun sind
Holen Sie sich eine Data-Science-Zertifizierung von den besten Universitäten der Welt. Lernen Sie Executive PG-Programme, Advanced Certificate-Programme oder Master-Programme, um Ihre Karriere zu beschleunigen.
Fazit
Jetzt, da wir neue Fortschritte entwickeln, von denen erwartet wird, dass sie Informationen sammeln, verbreiten und nutzen, um im Kampf gegen jede Pandemie zu helfen, müssen wir auch sicherstellen, dass sie ethische Best Practices respektieren. Tatsächlich müssen wir selbst in einem Notfall Datensicherheitsrichtlinien befolgen und garantieren, dass die Informationen ethisch korrekt genutzt werden.
Pioniere in Regierungen, Unternehmen und medizinischen Diensten dazu zu bringen, diesen Tools zu vertrauen, würde die Art und Weise, wie schnell wir auf Krankheitsausbrüche reagieren, grundlegend verändern.
Wenn Sie neugierig sind, mehr über Data Science zu erfahren, schauen Sie sich das PG Diploma in Data Science von IIIT-B & upGrad an, das für Berufstätige entwickelt wurde und mehr als 10 Fallstudien und Projekte, praktische Workshops, Mentoring mit Branchenexperten, 1- on-1 mit Mentoren aus der Branche, mehr als 400 Stunden Lern- und Jobunterstützung bei Top-Unternehmen.
Wie können Suchmaschinen bei der Prävention einer Pandemie helfen?
Entscheidungsträger können mithilfe von Big Data aus Suchmaschinen Benutzeranforderungen und Hotspots in Echtzeit erfassen, um Entscheidungen zur Pandemieprävention zu unterstützen. Die aus der Suche gewonnenen Informationen können verwendet werden, um Pandemien zu vermeiden und zu kontrollieren, indem die Verbraucheranforderungen während des Ausbruchs, die Materialzuteilung, die Produktinnovation nach der Pandemie und die Branchenentwicklung besser verstanden werden. Navigations- und Suchmaschinendaten sind ebenso wie Social-Media-Daten wichtige Quellen für die Krankheitsprävention und kontrollieren Big Data. Sie haben nichts mit medizinischer Therapie oder Krankheitsdiagnose zu tun, aber ihre prospektiven Informationen können Krankheitsverläufe darstellen und Menschen auf bestimmte Zustände aufmerksam machen.
Wie kann visuelle Analysetechnologie zur Pandemieprävention beitragen?
Es ist möglich, Korrelationen zwischen großen Datensätzen mit visuellen Analysetechnologien zu erkennen, was den Ermittlern eine intuitivere visuelle Wahrnehmung und eine effiziente Entscheidungshilfe ermöglicht. Derzeit können die Regierung und wichtige politische Entscheidungsträger die oben genannten Big-Data-Quellen nutzen, um eine visuelle Analyse der Überwachung der Pandemiesituation, der medizinischen Ressourcen, der Krankenhausunternehmen und der Überprüfung enger Kontakte durchzuführen, um Entscheidungen zu treffen. Alle Regierungen verwenden visuelle Analysen von Big Data, um kritische COVID-Indikatoren wie Falldaten, Virusausbreitung, Trends der Pandemiesituation und Hotspot-Berichte in Echtzeit zu visualisieren. Die Technologie kann das Recht der Öffentlichkeit auf Information im größtmöglichen Umfang erfüllen, und sie ermöglicht politischen Entscheidungsträgern ein umfassendes Verständnis der Pandemiesituation und hilft bei der wissenschaftlichen Entscheidungsfindung.
Welche Rolle kann NLP bei der Prävention der Pandemie spielen?
Eine Regierung könnte die Genauigkeit der Spracherkennung verbessern, indem sie Deep Learning für die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) verwendet. Eine solche Erkennung umfasst die Entitätserkennung, die automatische Textkategorisierung von sensiblem Material, Papieren, Berichten, Nachrichten und so weiter. Zur Überwachung öffentlicher Einstellungen im Internet, Frühwarnsystemen, Informationskommunikationsmechanismen, Gerüchtesuche, der Flut der Analyse der öffentlichen Meinung und der öffentlichen Beschwichtigung können diese Informationen über das Internet und soziale Netzwerkplattformen eingeholt werden. Die Technologie zur Verarbeitung natürlicher Sprache (NLP) kann bei der Frühwarnung, der Verbreitung von Gerüchten, der Verfolgung von Krankheitsdynamiken, sozialen Brennpunkten und dem Informationsschub bei der Prävention und Bekämpfung von Pandemien helfen.