Co może zrobić analiza danych, aby zapobiec pandemii w przyszłości?

Opublikowany: 2020-05-19

Obecnie stoimy w obliczu ogólnoświatowej sytuacji kryzysowej. Z punktu widzenia zdrowia publicznego, aby zwalczyć epidemię, władze muszą podjąć różne działania, na przykład tworzenie skutecznej świadomości, ustalanie wytycznych dla ekspertów w dziedzinie zdrowia, zwalczanie klastrów skażenia, ograniczanie rozwoju populacji i przydzielanie skąpych zasobów.

Szybka i dokładna analiza danych, która może identyfikować epidemie i przewidywać ruch, ma kluczowe znaczenie w walce z nieuleczalnymi infekcjami. Metodologie historyczne, takie jak raporty badaczy i rejestry szpitalne, są niezawodne, ale w najlepszym razie umiarkowane w prognozowaniu. Rośnie przekonanie, że bardziej aktualne metodologie, w tym śledzenie telefonów komórkowych i eksploracja danych w wyszukiwarkach i mediach społecznościowych, mogą pomóc w uzyskaniu szybszego, coraz bardziej dopracowanego obrazu tego, gdzie choroby się rozwijają i gdzie mogą się dalej rozprzestrzeniać.

Nauka o danych może odegrać ważną rolę w rozbiciu testów osób na dużą skalę, łącząc te wyniki z anonimowymi atrybutami zdrowotnymi hospitalizowanych pacjentów. Umożliwiłoby nam to zrozumienie kluczowych czynników ryzyka i lepszą ochronę osób, które są najbardziej narażone na zakażenie. Im więcej informacji, tym dokładniejsze mogą być te przewidywania.

Spis treści

Moc przewidywania

Innowacyjność przewidywania zmieniła wiele przedsiębiorstw w ciągu ostatnich 20 lat. Organizacje takie jak BlueDot i Metabiota wykorzystują szereg algorytmów przetwarzania języka naturalnego (NLP) do sprawdzania serwisów informacyjnych i oficjalnych raportów medycznych w różnych językach na całym świecie. Ich urządzenia predykcyjne mogą również korzystać z informacji dotyczących podróży lotniczych, aby zbadać ryzyko, że węzły tranzytowe mogą zobaczyć skażone osoby, które pojawiają się lub odchodzą.

Wykorzystując różne źródła dużych zbiorów danych, modele uczenia maszynowego można wytrenować w celu ilościowego określenia klinicznego ryzyka rozwoju ciężkiej choroby u osoby, która zachoruje na poważną infekcję, taką jak COVID-19: jakie jest prawdopodobieństwo, że będą wymagały specjalistycznej opieki, dla których Są limitowane? Jakie jest prawdopodobieństwo, że zachorują? Takie dane mogą obejmować podstawowe historie medyczne ludzi.

Wyniki są sensownie dokładne. Na przykład ostatni publiczny raport Metabioty z 25 lutego przewidywał, że 3 marca na całym świecie będzie 127 000 przypadków COVID-19 . Liczba ta została przekroczona o około 30 000, ale Mark Gallivan, ówczesny dyrektor Data Science firmy, powiedział, że nadal jest to obszar błędu. Dodatkowo odnotowała kraje, które najprawdopodobniej zgłaszają nowe przypadki, w tym Chiny, Włochy, Iran i Stany Zjednoczone Ameryki.

System Google DeepMind AI jest używany do rozróżniania atrybutów wirusa, co może pomóc w zrozumieniu jego działania. Te dane okażą się pomocne w ustaleniu, jakich leków szukać. Inni włączyli technologię opracowaną przez brytyjski start-up bioinformatyczny BenevolentAI, który wykorzystuje sztuczną inteligencję do znajdowania obiecujących istniejących metod leczenia różnych chorób, które mogą być skuteczne w leczeniu COVID-19.

Pomogło również wykorzystanie przez Chiny technologii rozpoznawania twarzy SenseTime i oprogramowania do wykrywania temperatury w celu wykrywania osób, które mogą mieć gorączkę i mogą mieć infekcję. Podobna innowacja napędza „inteligentne kaski”, które są wykorzystywane przez władze na terytorium Syczuanu do wykrywania osób z gorączką.

Chiński rząd dodatkowo zbudował system monitorowania o nazwie Health Code, który wykorzystuje duże zbiory danych do identyfikacji i oceny ryzyka każdej osoby w zależności od jej historii podróży, ilości czasu spędzonego w hotspotach infekcji i potencjalnego narażenia na osoby z wirusem . Mieszkańcy otrzymują kod koloru (czerwony, żółty lub zielony), który mogą uzyskać za pomocą popularnych aplikacji WeChat lub AliPay, aby pokazać, czy należy ich odizolować, czy też zezwolić na publiczne wychodzenie.

W przeciwieństwie do testów medycznych, które są rzadkie, kosztowne i często dostarczane z opóźnieniami, to oparte na danych klinicznych podejście do cyfrowej personalizacji może być zastosowane szybko i jest dość łatwe do skalowania. Pozwoliłoby to na lepszą i bardziej atrakcyjną alokację aktywów w przypadku rzadkiego sprzętu medycznego, na przykład jednostek testowych, masek ochronnych i łóżek szpitalnych.

Mogłoby to zapewnić nam odpowiednie modele i umożliwić bardziej bezpieczne usuwanie kwarantanny w znacznie szybszym tempie, niż pozwalają na to obecne najlepsze praktyki dotyczące COVID-19 podzielone na ścieżki testowe, zgodnie z którymi każdy zarażony i jego kontakty pozostaną w zamknięciu, niezależnie od czy są ogólnie bezpieczne, czy też wykazują objawy ciężkiej choroby.

Wydobywanie danych

Informacje o mobilności ludzi i dane telekomunikacyjne, które zostały wykorzystane podczas wybuchu epidemii eboli w Afryce Zachodniej, zostały dodatkowo zbadane przez UNICEF Innovation Lab, Flowminder i inne organizacje. Podstawowym celem nadrzędnym jest zrozumienie trendów mobilności ludzi w odniesieniu do środków blokowania i ocena niebezpieczeństwa postępu choroby w określonym regionie.

Na ziemi, korzystając z aplikacji EPI Info Wirusowa Gorączka Krwotoczna, ta choroba może być kontrolowana, program o otwartym kodzie źródłowym, który identyfikuje osoby narażone na wirusa i buduje ogromną bazę danych danych pacjentów, która obejmuje imię i nazwisko, płeć, wiek, lokalizację, stan medyczny historia i wiele innych identyfikatorów.

W zastosowaniu analityki dużych zbiorów danych szwedzka firma Flowminder wykorzystała rejestry rozmów telefonicznych z 2013 r. w Senegalu, aby nałożyć poprzednie epidemie infekcji na wzorce ruchu, aby przewidzieć ruch i wzrost wirusa Ebola w kraju. Chociaż znaczna część reakcji na Ebolę opiera się na infrastrukturze fizycznej i operacjach, jasne jest, że reakcja jest wzmacniana przez zdolność do wykorzystania danych.

Drugą zachęcającą drogą jest eksploracja danych w mediach społecznościowych i aktywności wyszukiwarek, która może szybko pokazać, gdzie występuje epidemia. Jednak dane pochodzące z udostępniania społecznościowego i zapytań wyszukiwarek mogą wprowadzać w błąd i nie należy im ufać wyłącznie. Zamiast tego organizacje opieki zdrowotnej konsolidują informacje z tych źródeł z tradycyjnymi zestawami danych medycznych i wykorzystują umiejętności medyczne podczas analizowania trendów. Daniel Bausch , dyrektor zespołu szybkiego wsparcia zdrowia publicznego w Wielkiej Brytanii , dostrzega niesamowity potencjał w zestawach danych gromadzonych z mediów społecznościowych.

Niedawno Laboratorium Big Data w Biurze Projektu Strategii Rozwoju Niżnego Nowogrodu opracowało model matematyczny do przewidywania rozprzestrzeniania się COVID-19. W modelu wykorzystano informacje o większości krajów i okręgów, które opublikowały statystyki dotyczące COVID-19, w tym 297 regionów świata i 21 terytoriów we Włoszech.

Zespół stale obserwował rosyjskie i światowe badania nad COVID-19. Oznacza to, że mogliby zbierać informacje do modelu z całego świata, zarówno zagregowane według krajów, jak i dystrybuowane według regionu i mniejszych terytoriów. W analizie uwzględniono kilkadziesiąt miast miejskich, w celu wyróżnienia tych o parametrach epidemiologicznych najbardziej zbliżonych do własnych (polityka, wielkość i gęstość zaludnienia). Tak opracowany model pomaga w prognozowaniu pandemii z dokładnością do 2,5%.

Jednym z podejść do przyjęcia jest utworzenie niezależnych komisji etycznych lub trustów danych. Ich zadaniem byłoby stworzenie mechanizmów zarządzania danymi w celu odkrycia harmonii pomiędzy rywalizującymi interesami publicznymi, a zapewnieniem indywidualnego bezpieczeństwa.

Przeczytaj także: Produktywne rzeczy do zrobienia w Lockdown

Uzyskaj certyfikat data science od najlepszych światowych uniwersytetów. Naucz się programów Executive PG, Advanced Certificate Programs lub Masters Programs, aby przyspieszyć swoją karierę.

Wniosek

Teraz, gdy opracowujemy nowe rozwiązania, które mają gromadzić, rozpowszechniać i wykorzystywać informacje, aby pomóc w walce z jakąkolwiek pandemią, musimy również zapewnić, że przestrzegają one najlepszych praktyk etycznych. Rzeczywiście, nawet w sytuacji awaryjnej musimy przestrzegać wytycznych dotyczących bezpieczeństwa danych i zagwarantować, że informacje są wykorzystywane w sposób etyczny.

Pozyskanie pionierów w rządach, firmach i usługach medycznych, aby zaufali tym narzędziom, zasadniczo zmieniłoby szybkość reakcji na wybuchy chorób.

Jeśli jesteś zainteresowany nauką o danych, sprawdź IIIT-B i upGrad's PG Diploma in Data Science, który jest stworzony dla pracujących profesjonalistów i oferuje ponad 10 studiów przypadków i projektów, praktyczne warsztaty praktyczne, mentoring z ekspertami z branży, 1- on-1 z mentorami branżowymi, ponad 400 godzin nauki i pomocy w pracy z najlepszymi firmami.

Jak wyszukiwarki mogą pomóc w zapobieganiu pandemii?

Decydenci mogą gromadzić żądania użytkowników i punkty aktywne w czasie rzeczywistym, korzystając z dużych zbiorów danych z wyszukiwarek, aby pomóc w podejmowaniu decyzji dotyczących zapobiegania pandemii. Informacje uzyskane z wyszukiwań mogą być wykorzystywane do unikania i kontrolowania pandemii poprzez lepsze zrozumienie potrzeb konsumentów podczas epidemii, alokacji materiałów, po pandemii innowacji produktów i rozwoju przemysłu. Dane z nawigacji i wyszukiwarek, podobnie jak dane z mediów społecznościowych, są głównymi źródłami zapobiegania chorobom i kontrolują duże zbiory danych. Nie mają nic wspólnego z terapią medyczną lub diagnozą choroby, ale ich przyszłe informacje mogą przedstawiać postęp choroby i zwracać uwagę ludzi na pewne schorzenia.

W jaki sposób technologia analizy wizualnej może przyczynić się do zapobiegania pandemii?

Możliwe jest rozpoznanie korelacji między dużymi zbiorami danych za pomocą technologii analizy wizualnej, co pozwala badaczom uzyskać bardziej intuicyjne poznanie wizualne i pomoc w skutecznym podejmowaniu decyzji. Obecnie rząd i kluczowi decydenci mogą wykorzystać wspomniane źródła big data do przeprowadzenia wizualnej analizy monitoringu sytuacji pandemicznej, zasobów medycznych, przedsiębiorstw szpitalnych oraz badań przesiewowych bliskiego kontaktu w celu dokonywania wyborów. Wszystkie rządy wykorzystują wizualne analizy dużych zbiorów danych do wizualizacji w czasie rzeczywistym krytycznych wskaźników COVID, takich jak dane dotyczące przypadków, rozprzestrzenianie się wirusów, trendy sytuacji pandemicznej i raporty dotyczące hotspotów. Technologia może w największym możliwym stopniu wypełnić prawo społeczeństwa do wiedzy i umożliwia decydentom pełne zrozumienie sytuacji pandemicznej i pomoc w podejmowaniu decyzji naukowych.

Jaką rolę może odegrać NLP w zapobieganiu pandemii?

Rząd może poprawić dokładność rozpoznawania mowy, używając uczenia głębokiego do przetwarzania języka naturalnego (NLP). Takie rozpoznawanie obejmuje rozpoznawanie jednostek, automatyczną kategoryzację tekstu wrażliwych materiałów, artykułów, raportów, wiadomości i tak dalej. W celu monitorowania nastrojów społecznych w Internecie, systemów wczesnego ostrzegania, mechanizmów przekazywania informacji, eksploracji pogłosek, przebiegu analizy opinii publicznej i ułagodzenia opinii publicznej, informacje te można pozyskiwać za pośrednictwem Internetu i platform społecznościowych. Technologia przetwarzania języka naturalnego (NLP) może pomóc we wczesnym ostrzeganiu, rozpowszechnianiu plotek, śledzeniu dynamiki choroby, gorących punktach społecznościowych i przekazywaniu informacji w zapobieganiu i kontrolowaniu pandemii.