Cosa può fare la scienza dei dati per aiutare a prevenire le pandemie in futuro?

Pubblicato: 2020-05-19

Attualmente stiamo affrontando un'emergenza mondiale. Dal punto di vista della salute pubblica, per combattere un'epidemia, le autorità devono intraprendere varie azioni, ad esempio creare una consapevolezza efficace, definire linee guida per gli esperti di salute, prendere di mira i cluster di contaminazione, limitare lo sviluppo della popolazione e allocare risorse scarse.

Un'analisi dei dati rapida e accurata in grado di individuare focolai e anticipare i movimenti è fondamentale per combattere infezioni irresistibili. Le metodologie storiche, come i rapporti degli investigatori e le cartelle cliniche, sono affidabili ma, nella migliore delle ipotesi, moderate nella previsione. C'è una convinzione crescente che metodologie più attuali, tra cui il monitoraggio del cellulare e il data mining dei motori di ricerca e dei social media, possano aiutare a fornire un quadro più rapido e progressivamente perfezionato di dove si stanno manifestando le malattie e dove potrebbero diffondersi successivamente.

La scienza dei dati può svolgere un ruolo importante nell'abbattere i test su larga scala degli individui collegando questi risultati con gli attributi sanitari anonimi dei pazienti ospedalizzati. Ciò ci consentirebbe di comprendere i principali fattori di rischio e di proteggere meglio le persone a più alto rischio di infezione. Più informazioni ci sono, più precise potrebbero essere queste previsioni.

Sommario

Potere di previsione

L'innovazione della previsione ha cambiato numerose imprese negli ultimi 20 anni. Organizzazioni come BlueDot e Metabiota utilizzano un ambito di algoritmi di elaborazione del linguaggio naturale (NLP) per controllare i notiziari e i rapporti sanitari ufficiali in varie lingue in tutto il mondo. Allo stesso modo, i loro dispositivi predittivi possono attingere alle informazioni sui viaggi aerei per sondare il rischio che gli hub di transito possano vedere individui contaminati presentarsi o andarsene.

Utilizzando diverse fonti di big data, i modelli di machine learning potrebbero essere addestrati per quantificare il rischio clinico di una persona di sviluppare malattie gravi se contrae un'infezione grave come il COVID-19: qual è la probabilità che necessiti di cure specialistiche, per le quali le risorse sono limitati? Quante probabilità hanno di soccombere alla malattia? Tali dati potrebbero incorporare le storie mediche fondamentali delle persone.

I risultati sono sensibilmente accurati. Ad esempio, il rapporto pubblico più recente di Metabiota del 25 febbraio prevedeva che il 3 marzo ci sarebbero stati un totale di 1.27.000 casi di COVID-19 in tutto il mondo . Questo numero è stato superato di circa 30.000, ma Mark Gallivan, l'allora direttore della scienza dei dati dell'azienda, ha affermato che questo era ancora nella stanza dell'errore. Ha inoltre registrato le nazioni che hanno maggiori probabilità di segnalare nuovi casi, tra cui Cina, Italia, Iran e Stati Uniti d'America.

Il sistema DeepMind AI di Google viene utilizzato per distinguere gli attributi del virus, il che può aiutare a capire come funziona. Questi dati si sarebbero rivelati utili per determinare quali farmaci cercare. Altri hanno incorporato la tecnologia sviluppata dalla startup bioinformatica BenevolentAI con sede nel Regno Unito, che sta utilizzando l'intelligenza artificiale per trovare trattamenti esistenti promettenti per diverse malattie, che potrebbero essere efficaci nel trattamento del COVID-19.

Anche l'utilizzo da parte della Cina della tecnologia di riconoscimento facciale e del software di rilevamento della temperatura di SenseTime per rilevare individui che potrebbero avere la febbre e che potrebbero essere destinati ad avere l'infezione ha aiutato. Un'innovazione simile alimenta i "caschi intelligenti" utilizzati dalle autorità nel territorio del Sichuan per rilevare gli individui con la febbre.

Il governo cinese ha inoltre creato un sistema di monitoraggio chiamato Codice sanitario che utilizza i big data per identificare e valutare il rischio di ogni individuo in base alla sua storia di viaggio, alla quantità di tempo trascorso negli hotspot di infezione e alla potenziale esposizione alle persone con il virus . Ai residenti viene assegnato un codice colore (rosso, giallo o verde), che possono ottenere tramite le applicazioni tradizionali WeChat o AliPay per mostrare se devono essere isolati o autorizzati a uscire in pubblico.

A differenza dei test medici che sono scarsi, costosi e spesso consegnati con ritardi, questo approccio di personalizzazione digitale basato sui dati clinici può essere applicato rapidamente ed è abbastanza facile da scalare. Permetterebbe una migliore e più attraente asset allocation in caso di apparecchiature mediche rare, ad esempio unità di test, maschere protettive e letti d'ospedale.

Potrebbe fornirci i modelli corretti e consentire una de-quarantena più sicura a un ritmo molto più rapido di quanto consentito dalle attuali migliori pratiche separate per il test per COVID-19, in base alle quali chiunque sia infetto e i suoi contatti rimarrebbero in confinamento, indipendentemente se sono in generale sicuri o mostrano sintomi di una malattia grave.

Estrazione di dati

Le informazioni sulla mobilità umana e i dati sulle telecomunicazioni che sono stati utilizzati durante l'epidemia di Ebola in Africa occidentale e sono stati inoltre studiati dall'UNICEF Innovation Lab, Flowminder e altre organizzazioni. L'obiettivo primario di fondo è comprendere le tendenze della mobilità umana rispetto alle misure di blocco e valutare il pericolo che la malattia progredisca in una particolare regione.

Sul campo, utilizzando un'applicazione di EPI Info Viral Hemorrhagic Fever questa malattia può essere controllata, un programma open source che identifica le persone esposte al virus e costruisce un enorme database di dati dei pazienti che incorpora il nome, il sesso, l'età, l'ubicazione, il medico cronologia e numerosi altri identificatori.

Nell'applicazione dell'analisi dei big data, la società svedese Flowminder ha utilizzato i tabulati telefonici del 2013 in Senegal per sovrapporre i passati focolai di infezione ai modelli di traffico per prevedere il movimento e la crescita dell'Ebola all'interno della nazione. Sebbene una parte significativa della risposta all'Ebola sia stabilita nell'infrastruttura fisica e nelle operazioni, è chiaro che la risposta è aumentata dalla capacità di sfruttare i dati.

Una seconda strada incoraggiante è il data mining dei social media e dell'attività dei motori di ricerca, che possono mostrare rapidamente dove si sta verificando un focolaio. Tuttavia, i dati della condivisione sui social e delle query sui motori di ricerca potrebbero essere fuorvianti e non dovrebbero essere considerati esclusivamente attendibili. Piuttosto, le organizzazioni sanitarie stanno consolidando le informazioni provenienti da queste fonti con set di dati medici tradizionali e stanno utilizzando le capacità mediche per analizzare le tendenze. Daniel Bausch , direttore del team di supporto rapido per la salute pubblica del Regno Unito , vede un potenziale incredibile nei set di dati raccolti dai social media.

Di recente, il Big Data Laboratory presso l'Ufficio del progetto per la strategia di sviluppo di Nizhny Novgorod ha sviluppato un modello matematico per prevedere la diffusione del COVID-19. Il modello ha utilizzato le informazioni sulla maggior parte delle nazioni e dei distretti che hanno pubblicato approfondimenti sul COVID-19, comprese 297 regioni del mondo e 21 territori in Italia.

Il team ha osservato continuamente la ricerca russa e globale su COVID-19. Ciò implica che potrebbero raccogliere le informazioni per il modello da qualsiasi parte del mondo, sia aggregate per nazione, sia distribuite per regione e territori più piccoli. L'analisi ha incorporato alcune decine di città urbane, al fine di distinguere quelle che hanno parametri epidemiologici più vicini ai propri (politiche, dimensione e densità della popolazione). Il modello così sviluppato aiuta a prevedere la pandemia con una precisione del 2,5%.

Un approccio da adottare consiste nell'istituire comitati etici indipendenti o data trust. Il loro compito sarebbe creare meccanismi di governance dei dati per scoprire l'armonia tra interessi pubblici contrastanti garantendo al contempo la sicurezza individuale.

Leggi anche: Cose produttive da fare durante il lockdown

Ottieni la certificazione di data science dalle migliori università del mondo. Impara i programmi Executive PG, Advanced Certificate Program o Master per accelerare la tua carriera.

Conclusione

Ora, mentre sviluppiamo nuovi progressi che dovrebbero raccogliere, diffondere e utilizzare le informazioni per aiutare nella battaglia contro qualsiasi pandemia, dobbiamo anche assicurarci che rispettino le migliori pratiche etiche. In effetti, anche in un'emergenza, dobbiamo seguire le linee guida sulla sicurezza dei dati e garantire che le informazioni vengano sfruttate eticamente.

Convincere i pionieri di governi, aziende e servizi medici a fidarsi di questi strumenti cambierebbe radicalmente la rapidità con cui rispondiamo alle epidemie.

Se sei curioso di conoscere la scienza dei dati, dai un'occhiata al Diploma PG in Data Science di IIIT-B e upGrad, creato per i professionisti che lavorano e offre oltre 10 casi di studio e progetti, workshop pratici pratici, tutoraggio con esperti del settore, 1- on-1 con mentori del settore, oltre 400 ore di apprendimento e assistenza al lavoro con le migliori aziende.

In che modo i motori di ricerca possono aiutare nella prevenzione della pandemia?

I decisori possono raccogliere le richieste degli utenti e gli hotspot in tempo reale utilizzando i big data dai motori di ricerca per aiutare nelle scelte di prevenzione della pandemia. Le informazioni ottenute dalle ricerche possono essere utilizzate per evitare e controllare le pandemie comprendendo meglio le richieste dei consumatori durante l'epidemia, l'allocazione dei materiali, l'innovazione dei prodotti post-pandemia e lo sviluppo del settore. I dati di navigazione e dei motori di ricerca, come i dati dei social media, sono le principali fonti di prevenzione delle malattie e controllano i big data. Non hanno nulla a che fare con la terapia medica o la diagnosi di malattie, ma le loro informazioni potenziali possono rappresentare la progressione della malattia e attirare l'attenzione delle persone su determinate condizioni.

In che modo la tecnologia di analisi visiva può contribuire alla prevenzione della pandemia?

È possibile riconoscere le correlazioni tra set di dati di grandi dimensioni utilizzando tecnologie di analisi visiva, consentendo agli investigatori di ottenere una cognizione visiva più intuitiva e un aiuto decisionale efficiente. Attualmente, il governo e i principali responsabili politici possono utilizzare le suddette fonti di big data per intraprendere un'analisi visiva del monitoraggio della situazione pandemica, delle risorse mediche, delle imprese ospedaliere e dello screening dei contatti ravvicinati al fine di effettuare delle scelte. Tutti i governi utilizzano analisi visive dei big data per visualizzare indicatori COVID critici come dati sui casi, dispersione dei virus, tendenze della situazione pandemica e rapporti sugli hotspot in tempo reale. La tecnologia può soddisfare il diritto del pubblico di sapere nella massima misura possibile e consente ai responsabili politici di avere una comprensione completa della situazione pandemica e aiutare nel processo decisionale scientifico.

Quale ruolo può svolgere la PNL nella prevenzione della pandemia?

Un governo potrebbe migliorare la precisione del riconoscimento vocale utilizzando il deep learning per l'elaborazione del linguaggio naturale (NLP). Tale riconoscimento include il riconoscimento dell'entità, la categorizzazione automatizzata del testo di materiale sensibile, documenti, rapporti, notizie e così via. Per monitorare l'atteggiamento del pubblico su Internet, i sistemi di allerta precoce, i meccanismi di comunicazione delle informazioni, l'estrazione di voci, l'analisi della marea dell'opinione pubblica e la pacificazione pubblica, queste informazioni possono essere ottenute tramite Internet e le piattaforme di social networking. La tecnologia di elaborazione del linguaggio naturale (PNL) può aiutare con l'allarme precoce, la diffusione di voci, il monitoraggio delle dinamiche della malattia, i punti critici sociali e la spinta informativa nella prevenzione e nel controllo della pandemia.