Que peut faire la science des données pour aider à prévenir les pandémies à l'avenir ?

Publié: 2020-05-19

Nous sommes actuellement confrontés à une urgence mondiale. D'un point de vue de santé publique, pour lutter contre une épidémie, les autorités doivent prendre diverses mesures, par exemple, créer une sensibilisation efficace, établir des lignes directrices pour les experts de la santé, cibler les foyers de contamination, limiter l'évolution de la population et allouer des ressources rares.

Des analyses de données rapides et précises qui peuvent identifier les épidémies et anticiper les mouvements sont essentielles pour lutter contre les infections irrésistibles. Les méthodologies historiques, telles que les rapports d'investigation et les dossiers hospitaliers, sont fiables mais au mieux modérées pour les prévisions. On croit de plus en plus que des méthodologies plus actuelles, y compris le suivi des téléphones portables et l'exploration de données des moteurs de recherche et des médias sociaux, peuvent aider à donner une image plus rapide et progressivement affinée de l'endroit où les maladies se propagent et où elles pourraient se propager ensuite.

La science des données peut jouer un rôle important dans la décomposition des tests à grande échelle des individus en reliant ces résultats aux attributs de santé anonymisés des patients hospitalisés. Cela nous permettrait de comprendre les principaux facteurs de risque et de mieux protéger les personnes les plus exposées au risque d'infection. Plus il y a d'informations, plus ces prédictions peuvent être précises.

Table des matières

Pouvoir de prédiction

L'innovation de la prédiction a changé de nombreuses entreprises au cours des 20 dernières années. Des organisations comme BlueDot et Metabiota utilisent une gamme d'algorithmes de traitement du langage naturel (NLP) pour filtrer les médias et les rapports officiels sur les soins de santé dans différentes langues à travers le monde. Leurs dispositifs prédictifs peuvent également s'appuyer sur les informations sur les voyages en avion pour évaluer le risque que les centres de transit puissent voir des personnes contaminées se présenter ou partir.

En utilisant différentes sources de données volumineuses, des modèles d'apprentissage automatique pourraient être entraînés pour quantifier le risque clinique d'une personne de développer une maladie grave si elle contracte une infection grave telle que la COVID-19 : quelle est la probabilité qu'elle ait besoin de soins spécialisés, pour lesquels les actifs sont limités ? Quelle est la probabilité qu'ils succombent à la maladie ? Ces données pourraient intégrer les antécédents médicaux fondamentaux des personnes.

Les résultats sont sensiblement précis. Par exemple, le dernier rapport public de Metabiota du 25 février prévoyait que le 3 mars, il y aurait un total de 1 27 000 cas de COVID-19 dans le monde . Ce nombre a été dépassé d'environ 30 000, mais Mark Gallivan, alors directeur de la science des données de l'entreprise, a déclaré que cela restait dans la marge d'erreur. Il a également enregistré les pays les plus susceptibles de signaler de nouveaux cas, notamment la Chine, l'Italie, l'Iran et les États-Unis d'Amérique.

Le système DeepMind AI de Google est utilisé pour distinguer les attributs du virus, ce qui peut aider à comprendre son fonctionnement. Ces données s'avéreraient utiles pour déterminer quels médicaments rechercher. D'autres ont intégré la technologie développée par la startup britannique de bioinformatique BenevolentAI, qui utilise l'intelligence artificielle pour trouver des traitements existants prometteurs pour différentes maladies, qui pourraient être efficaces pour traiter le COVID-19.

L'utilisation par la Chine de la technologie de reconnaissance faciale et du logiciel de détection de température de SenseTime pour détecter les personnes susceptibles d'avoir de la fièvre et susceptibles d'avoir l'infection a également aidé. Une innovation similaire alimente les « casques intelligents » qui sont utilisés par les autorités du territoire du Sichuan pour détecter les personnes fiévreuses.

Le gouvernement chinois a en outre mis en place un système de surveillance appelé Health Code qui utilise des mégadonnées pour identifier et évaluer le risque de chaque individu en fonction de ses antécédents de voyage, du temps qu'il a passé dans les points chauds d'infection et de l'exposition potentielle aux personnes atteintes du virus. . Les résidents se voient attribuer un code couleur (rouge, jaune ou vert), qu'ils peuvent obtenir via les applications grand public WeChat ou AliPay pour indiquer s'ils doivent être isolés ou autorisés à sortir dans le public.

Contrairement aux tests médicaux qui sont rares, coûteux et souvent livrés avec des retards, cette approche de personnalisation numérique basée sur les données cliniques peut être appliquée rapidement et est assez facile à mettre à l'échelle. Cela permettrait une allocation d'actifs meilleure et plus attractive dans le cas d'équipements médicaux rares, par exemple, des unités de test, des masques de protection et des lits d'hôpitaux.

Cela pourrait nous donner les bons modèles et permettre une dé-quarantaine plus sécurisée à un rythme beaucoup plus rapide que celui autorisé par les meilleures pratiques actuelles séparées par piste de test pour COVID-19, en vertu desquelles toute personne infectée et ses contacts resteraient confinés, indépendamment savoir s'ils sont en général sûrs ou s'ils présentent des symptômes de maladie grave.

Extraction de données

Les informations sur la mobilité humaine et les données de télécommunication qui ont été utilisées lors de l'épidémie d'Ebola en Afrique de l'Ouest et qui ont également été étudiées par le laboratoire d'innovation de l'UNICEF, Flowminder et d'autres organisations. L'objectif principal sous-jacent est de comprendre les tendances de la mobilité humaine en ce qui concerne les mesures de confinement et d'évaluer le danger de progression de la maladie dans une région particulière.

Sur le terrain, en utilisant une application d'EPI Info Viral Hemorrhagic Fever this Disease can be Control, un programme open source qui identifie les personnes exposées au virus et crée une énorme base de données de données sur les patients qui intègre le nom, le sexe, l'âge, le lieu, le historique et de nombreux autres identifiants.

Dans l'application de l'analyse des mégadonnées, la société suédoise Flowminder a utilisé les enregistrements téléphoniques de 2013 au Sénégal pour superposer les épidémies passées d'infection sur les modèles de trafic afin de prévoir le mouvement et la croissance d'Ebola au sein du pays. Alors qu'une partie importante de la réponse à Ebola est établie dans l'infrastructure physique et les opérations, il est clair que la réponse est renforcée par la capacité à exploiter les données.

Une deuxième voie encourageante est l'exploration de données de l'activité des médias sociaux et des moteurs de recherche, qui peut rapidement montrer où une épidémie se produit. Cependant, les données provenant du partage social et des requêtes des moteurs de recherche peuvent être trompeuses et ne doivent pas être exclusivement fiables. Au lieu de cela, les organisations de soins de santé consolident les informations provenant de ces sources avec des ensembles de données médicales traditionnelles et utilisent les capacités médicales pour disséquer les tendances. Daniel Bausch , le directeur de l'équipe de soutien rapide de la santé publique au Royaume-Uni , voit un potentiel incroyable dans les ensembles de données recueillies à partir des médias sociaux.

Récemment, le Big Data Laboratory du Bureau du projet de stratégie de développement de Nizhny Novgorod a développé un modèle mathématique pour prédire la propagation du COVID-19. Le modèle a utilisé les informations sur la plupart des pays et des districts qui ont publié des informations sur le COVID-19, y compris 297 régions du monde et 21 territoires en Italie.

L'équipe a continuellement observé la recherche russe et mondiale sur le COVID-19. Cela implique qu'ils pourraient rassembler les informations pour le modèle partout dans le monde, à la fois agrégées par nation et distribuées par région et territoires plus petits. L'analyse a intégré quelques dizaines de villes urbaines, afin de distinguer celles qui présentent des paramètres épidémiologiques les plus proches des leurs (politiques, taille et densité de population). Le modèle ainsi développé aide à prévoir la pandémie avec une précision de 2,5 %.

Une approche à adopter consiste à mettre en place des comités d'éthique indépendants ou des fiducies de données. Leur travail serait de créer des mécanismes de gouvernance des données pour découvrir l'harmonie entre les intérêts publics opposés tout en assurant la sécurité individuelle.

Lisez aussi: Choses productives à faire pendant le verrouillage

Obtenez une certification en science des données des meilleures universités du monde. Apprenez les programmes Executive PG, les programmes de certificat avancés ou les programmes de maîtrise pour accélérer votre carrière.

Conclusion

Maintenant, alors que nous développons de nouvelles avancées censées collecter, diffuser et utiliser des informations pour aider à lutter contre toute pandémie, nous devons également nous assurer qu'elles respectent les meilleures pratiques éthiques. En effet, même en cas d'urgence, nous devons suivre les directives de sécurité des données et garantir que les informations sont exploitées de manière éthique.

Amener les pionniers des gouvernements, des entreprises et des services médicaux à faire confiance à ces outils changerait fondamentalement la rapidité avec laquelle nous réagissons aux épidémies.

Si vous êtes curieux d'en savoir plus sur la science des données, consultez le diplôme PG de IIIT-B & upGrad en science des données qui est créé pour les professionnels en activité et propose plus de 10 études de cas et projets, des ateliers pratiques, un mentorat avec des experts de l'industrie, 1- on-1 avec des mentors de l'industrie, plus de 400 heures d'apprentissage et d'aide à l'emploi avec les meilleures entreprises.

Comment les moteurs de recherche peuvent-ils aider à prévenir la pandémie ?

Les décideurs peuvent collecter les demandes des utilisateurs et les points d'accès en temps réel à l'aide de mégadonnées provenant de moteurs de recherche pour faciliter les choix de prévention de la pandémie. Les informations obtenues à partir des recherches peuvent être utilisées pour aider à éviter et à contrôler les pandémies en comprenant mieux les demandes des consommateurs pendant l'épidémie, l'allocation des matériaux, l'innovation des produits post-pandémiques et le développement de l'industrie. Les données de navigation et des moteurs de recherche, comme les données des médias sociaux, sont des sources majeures de prévention des maladies et elles contrôlent les mégadonnées. Ils n'ont rien à voir avec la thérapie médicale ou le diagnostic de la maladie, mais leurs informations prospectives peuvent représenter la progression de la maladie et attirer l'attention des gens sur certaines conditions.

Comment la technologie d'analyse visuelle peut-elle contribuer à la prévention des pandémies ?

Il est possible de reconnaître des corrélations entre de grands ensembles de données à l'aide de technologies d'analyse visuelle, permettant aux enquêteurs d'obtenir une cognition visuelle plus intuitive et une aide à la prise de décision efficace. Actuellement, le gouvernement et les principaux décideurs politiques peuvent utiliser les sources de données volumineuses susmentionnées pour entreprendre une analyse visuelle de la surveillance de la situation pandémique, des ressources médicales, des entreprises hospitalières et du dépistage des contacts étroits afin de faire des choix. Tous les gouvernements utilisent des analyses visuelles des mégadonnées pour visualiser les indicateurs COVID critiques tels que les données de cas, la dispersion du virus, les tendances de la situation pandémique et les rapports sur les points chauds en temps réel. La technologie peut satisfaire le droit du public à savoir dans toute la mesure du possible, et elle permet aux décideurs politiques d'avoir une compréhension globale de la situation pandémique et d'aider à la prise de décision scientifique.

Quel rôle la PNL peut-elle jouer dans la prévention de la pandémie ?

Un gouvernement pourrait améliorer la précision de la reconnaissance vocale en utilisant l'apprentissage en profondeur pour le traitement du langage naturel (TAL). Cette reconnaissance comprend la reconnaissance d'entités, la catégorisation automatisée des textes de documents sensibles, d'articles, de rapports, d'actualités, etc. Pour surveiller les attitudes du public sur Internet, les systèmes d'alerte précoce, les mécanismes de communication d'informations, l'extraction de rumeurs, la marée d'analyse de l'opinion publique et l'apaisement du public, ces informations peuvent être obtenues via Internet et les plateformes de réseaux sociaux. La technologie de traitement du langage naturel (TLN) peut aider à l'alerte précoce, à la diffusion de rumeurs, au suivi de la dynamique des maladies, aux points chauds sociaux et à la diffusion d'informations dans la prévention et le contrôle de la pandémie.