¿Qué puede hacer la ciencia de datos para ayudar a prevenir pandemias en el futuro?

Publicado: 2020-05-19

Actualmente nos enfrentamos a una emergencia mundial. Desde el punto de vista de la salud pública, para combatir una epidemia, las autoridades deben tomar varias medidas, por ejemplo, crear conciencia efectiva, establecer pautas para los expertos en salud, enfocarse en los grupos de contaminación, limitar el desarrollo de la población y asignar recursos escasos.

El análisis de datos rápido y preciso que puede identificar brotes y anticipar movimientos es fundamental para combatir infecciones irresistibles. Las metodologías históricas, como los informes de los investigadores y los registros hospitalarios, son confiables pero, en el mejor de los casos, moderadas en el pronóstico. Existe una creencia creciente de que las metodologías más actuales, incluido el rastreo de teléfonos celulares y la extracción de datos de los motores de búsqueda y las redes sociales, pueden ayudar a brindar una imagen más rápida y progresivamente refinada de dónde se están desarrollando las enfermedades y dónde pueden propagarse a continuación.

La ciencia de datos puede desempeñar un papel importante en el desglose de las pruebas a gran escala de individuos al conectar estos resultados con los atributos de salud anónimos de los pacientes hospitalizados. Esto nos permitiría comprender los factores de riesgo clave y proteger mejor a las personas que corren el mayor riesgo de infección. Cuanta más información haya, más precisas podrían ser estas predicciones.

Tabla de contenido

Poder de predicción

La innovación de la predicción ha cambiado numerosas empresas en los últimos 20 años. Organizaciones como BlueDot y Metabiota utilizan un alcance de algoritmos de procesamiento de lenguaje natural (NLP) para filtrar los medios de comunicación y los informes oficiales de atención médica en varios idiomas en todo el mundo. Sus dispositivos predictivos también pueden basarse en información de viajes aéreos para evaluar el riesgo de que los centros de tránsito puedan ver personas contaminadas que aparecen o se van.

Utilizando diferentes fuentes de big data, los modelos de aprendizaje automático podrían entrenarse para cuantificar el riesgo clínico de una persona de desarrollar una enfermedad grave si contrae una infección grave como COVID-19: ¿cuál es la probabilidad de que requiera atención especializada, para lo cual los activos ¿Están limitados? ¿Qué posibilidades hay de que sucumban a la enfermedad? Dichos datos podrían incorporar los antecedentes médicos fundamentales de las personas.

Los resultados son sensiblemente precisos. Por ejemplo, el informe público más reciente de Metabiota del 25 de febrero anticipó que el 3 de marzo habría un total de 127 000 casos de COVID-19 en todo el mundo . Este número se superó en alrededor de 30 000, pero Mark Gallivan, el entonces director de ciencia de datos de la empresa, dijo que esto todavía estaba dentro de la sala de error. Además, registró las naciones que tienen más probabilidades de informar nuevos casos, que incluyen a China, Italia, Irán y los Estados Unidos de América.

El sistema DeepMind AI de Google se está utilizando para distinguir los atributos del virus, lo que puede ayudar a comprender cómo funciona. Estos datos resultarían útiles para determinar qué medicamentos buscar. Otros han incorporado la tecnología desarrollada por BenevolentAI, una startup de bioinformática con sede en el Reino Unido, que está utilizando inteligencia artificial para encontrar tratamientos existentes prometedores para diferentes enfermedades, que podrían ser efectivos en el tratamiento de COVID-19.

El uso de China de la tecnología de reconocimiento facial y el software de detección de temperatura de SenseTime para detectar a las personas que pueden tener fiebre y que pueden tener la infección también ha ayudado. Una innovación similar impulsa los 'cascos inteligentes' que utilizan las autoridades en el territorio de Sichuan para detectar personas con fiebre.

El gobierno chino también ha construido un sistema de monitoreo llamado Código de Salud que emplea grandes datos para identificar y evaluar el riesgo de cada individuo según su historial de viajes, la cantidad de tiempo que han pasado en puntos críticos de infección y la posible exposición a personas con el virus. . A los residentes se les asigna un código de color (rojo, amarillo o verde), que pueden obtener a través de las aplicaciones principales WeChat o AliPay para mostrar si deben estar aislados o si deben salir en público.

A diferencia de las pruebas médicas que son escasas, costosas y, a menudo, se entregan con demoras, este enfoque de personalización digital basado en datos clínicos se puede aplicar rápidamente y es bastante fácil de escalar. Permitiría una asignación de activos mejor y más atractiva en el caso de equipos médicos raros, por ejemplo, unidades de prueba, máscaras protectoras y camas de hospital.

Podría empoderarnos con los modelos correctos y permitir una eliminación de la cuarentena más segura a un ritmo mucho más rápido que el permitido por las mejores prácticas actuales segregadas por pistas de prueba para COVID-19, según las cuales cualquier persona infectada y sus contactos permanecerían en confinamiento, independientemente de si son en general seguros o muestran síntomas de enfermedad grave.

Minería de datos

La información de movilidad humana y los datos de telecomunicaciones que se utilizaron durante el brote de ébola en África Occidental y que también han sido investigados por UNICEF Innovation Lab, Flowminder y otras organizaciones. El objetivo principal subyacente es comprender las tendencias de movilidad humana con respecto a las medidas de bloqueo y evaluar el peligro de que la enfermedad progrese en una región en particular.

En el terreno, mediante el uso de una aplicación de EPI Info Viral Hemorrhagic Fever this Disease can Control, un programa de código abierto que identifica a las personas expuestas al virus y crea una enorme base de datos de pacientes que incorpora el nombre, sexo, edad, ubicación, médico historial y muchos otros identificadores.

En la aplicación de análisis de big data, la empresa sueca Flowminder utilizó registros telefónicos de 2013 en Senegal para superponer brotes de infección anteriores en los patrones de tráfico para prever el movimiento y el crecimiento del ébola en el país. Si bien una parte significativa de la respuesta al ébola se establece en la infraestructura física y las operaciones, está claro que la respuesta se ve reforzada por la capacidad de aprovechar los datos.

Un segundo camino alentador es la extracción de datos de las redes sociales y la actividad de los motores de búsqueda, que pueden mostrar rápidamente dónde se está produciendo un brote. Sin embargo, los datos del intercambio social y las consultas del motor de búsqueda pueden ser engañosos y no se debe confiar exclusivamente en ellos. Más bien, las organizaciones de atención médica están consolidando la información de estas fuentes con conjuntos de datos médicos tradicionales y utilizando la capacidad médica al diseccionar tendencias. Daniel Bausch , el Director del Equipo de Apoyo Rápido de Salud Pública del Reino Unido , ve un potencial increíble en los conjuntos de datos recopilados de las redes sociales.

Recientemente, el Laboratorio de Big Data de la Oficina de Proyectos de Estrategia de Desarrollo de Nizhny Novgorod desarrolló un modelo matemático para predecir la propagación de COVID-19. El modelo utilizó la información de la mayoría de las naciones y distritos que han publicado información sobre el COVID-19, incluidas 297 regiones del mundo y 21 territorios en Italia.

El equipo observó continuamente la investigación rusa y global sobre COVID-19. Esto implica que podrían recopilar la información para el modelo de cualquier parte del mundo, tanto agregada por nación como distribuida por región y territorios más pequeños. El análisis incorporó unas pocas docenas de ciudades urbanas, para distinguir aquellas que tienen parámetros epidemiológicos más cercanos a los suyos (políticas, tamaño y densidad de población). El modelo así desarrollado ayuda a pronosticar la pandemia con una precisión del 2,5%.

Un enfoque a adoptar es establecer comités éticos independientes o fideicomisos de datos. Su trabajo sería crear mecanismos de gobierno de datos para descubrir la armonía entre los intereses públicos en conflicto mientras se garantiza la seguridad individual.

Lea también: Cosas productivas para hacer durante el confinamiento

Obtenga la certificación de ciencia de datos de las mejores universidades del mundo. Aprenda los programas Executive PG, los programas de certificación avanzada o los programas de maestría para acelerar su carrera.

Conclusión

Ahora, a medida que desarrollamos nuevos avances que se espera recopilen, difundan y utilicen información para ayudar en la batalla contra cualquier pandemia, también debemos asegurarnos de que respeten las mejores prácticas éticas. De hecho, incluso en medio de una emergencia, debemos seguir las pautas de seguridad de datos y garantizar que la información se explote de manera ética.

Hacer que los pioneros en los gobiernos, las empresas y los servicios médicos confíen en estas herramientas cambiaría fundamentalmente la rapidez con la que respondemos a los brotes de enfermedades.

Si tiene curiosidad por aprender sobre ciencia de datos, consulte el Diploma PG en ciencia de datos de IIIT-B y upGrad, creado para profesionales que trabajan y ofrece más de 10 estudios de casos y proyectos, talleres prácticos, tutoría con expertos de la industria, 1- on-1 con mentores de la industria, más de 400 horas de aprendizaje y asistencia laboral con las mejores empresas.

¿Cómo pueden ayudar los motores de búsqueda en la prevención de la pandemia?

Los responsables de la toma de decisiones pueden recopilar las demandas de los usuarios y los puntos de acceso en tiempo real utilizando grandes datos de los motores de búsqueda para ayudar en las opciones de prevención de pandemias. La información obtenida de las búsquedas puede usarse para ayudar a evitar y controlar pandemias al comprender mejor las demandas de los consumidores durante el brote, la asignación de materiales, la innovación de productos después de la pandemia y el desarrollo de la industria. Los datos de navegación y de los motores de búsqueda, al igual que los datos de las redes sociales, son fuentes importantes para la prevención de enfermedades y controlan el big data. No tienen nada que ver con la terapia médica o el diagnóstico de enfermedades, pero su información prospectiva puede representar la progresión de la enfermedad y llamar la atención de las personas sobre ciertas condiciones.

¿Cómo puede contribuir la tecnología de análisis visual a la prevención de pandemias?

Es posible reconocer correlaciones entre grandes conjuntos de datos utilizando tecnologías de análisis visual, lo que permite a los investigadores obtener una cognición visual más intuitiva y una ayuda eficiente para la toma de decisiones. Actualmente, el gobierno y los principales formuladores de políticas pueden utilizar las fuentes de big data antes mencionadas para realizar un análisis visual del monitoreo de la situación de la pandemia, los recursos médicos, las empresas hospitalarias y la detección de contactos cercanos para tomar decisiones. Todos los gobiernos utilizan análisis visuales de big data para visualizar indicadores críticos de COVID, como datos de casos, dispersión de virus, tendencias de situaciones pandémicas e informes de puntos críticos en tiempo real. La tecnología puede cumplir con el derecho del público a saber en la mayor medida posible, y permite a los formuladores de políticas tener una comprensión integral de la situación de la pandemia y ayudar en la toma de decisiones científicas.

¿Qué papel puede jugar la PNL en la prevención de la pandemia?

Un gobierno podría mejorar la precisión del reconocimiento de voz utilizando el aprendizaje profundo para el procesamiento del lenguaje natural (NLP). Dicho reconocimiento incluye el reconocimiento de entidades, la categorización automática de texto de material confidencial, artículos, informes, noticias, etc. Para monitorear las actitudes públicas en Internet, los sistemas de alerta temprana, los mecanismos de comunicación de información, la extracción de rumores, el análisis de la marea de la opinión pública y el apaciguamiento público, esta información puede obtenerse a través de Internet y las plataformas de redes sociales. La tecnología de procesamiento del lenguaje natural (NLP) puede ayudar con la alerta temprana, la difusión de rumores, el seguimiento de la dinámica de la enfermedad, los puntos críticos sociales y el impulso de la información en la prevención y el control de la pandemia.