O que a ciência de dados pode fazer para ajudar a prevenir pandemias no futuro?

Publicados: 2020-05-19

Atualmente, estamos enfrentando uma emergência mundial. Do ponto de vista da saúde pública, para combater uma epidemia, as autoridades devem realizar várias ações, por exemplo, criar uma conscientização efetiva, estabelecer diretrizes para especialistas em saúde, direcionar clusters de contaminação, limitar o desenvolvimento populacional e alocar recursos escassos.

A análise de dados rápida e precisa que pode identificar surtos e antecipar o movimento é fundamental para combater infecções irresistíveis. Metodologias históricas, como relatórios de investigadores e registros hospitalares, são confiáveis, mas moderadas na melhor das hipóteses. Há uma crença crescente de que metodologias mais atuais, incluindo rastreamento de celular e mineração de dados de mecanismos de busca e mídias sociais, podem ajudar a fornecer uma imagem mais rápida e progressivamente refinada de onde as doenças estão se espalhando e para onde elas podem se espalhar em seguida.

A ciência de dados pode desempenhar um papel importante na quebra de testes em larga escala de indivíduos, conectando esses resultados com os atributos de saúde anônimos de pacientes hospitalizados. Isso nos permitiria compreender os principais fatores de risco e proteger melhor os indivíduos com maior risco de infecção. Quanto mais informações houver, mais precisas essas previsões podem ser.

Índice

Poder de previsão

A inovação da previsão mudou inúmeras empresas nos últimos 20 anos. Organizações como BlueDot e Metabiota utilizam um escopo de algoritmos de processamento de linguagem natural (NLP) para rastrear agências de notícias e relatórios oficiais de saúde em vários idiomas ao redor do mundo. Seus dispositivos preditivos também podem se basear em informações de viagens aéreas para pesquisar o risco de que os centros de trânsito possam ver indivíduos contaminados aparecendo ou saindo.

Utilizando diferentes fontes de big data, os modelos de aprendizado de máquina podem ser treinados para quantificar o risco clínico de uma pessoa desenvolver uma doença grave se contrair uma infecção grave como o COVID-19: qual é a probabilidade de exigir cuidados especializados, para os quais os ativos são limitados? Qual a probabilidade de sucumbir à doença? Esses dados podem incorporar as histórias médicas fundamentais das pessoas.

Os resultados são sensivelmente precisos. Por exemplo, o relatório público mais recente da Metabiota em 25 de fevereiro previa que em 3 de março haveria um total de 1.27.000 casos de COVID-19 em todo o mundo . Esse número foi superado em cerca de 30.000, mas Mark Gallivan, o então diretor de ciência de dados da empresa, disse que isso ainda estava dentro da sala de erro. Além disso, registrou as nações com maior probabilidade de relatar novos casos, incluindo China, Itália, Irã e Estados Unidos da América.

O sistema DeepMind AI do Google está sendo usado para distinguir os atributos do vírus, o que pode ajudar a entender como ele funciona. Esses dados seriam úteis para determinar quais medicamentos procurar. Outros incorporaram a tecnologia desenvolvida pela startup de bioinformática BenevolentAI, com sede no Reino Unido, que está usando inteligência artificial para encontrar tratamentos promissores existentes para diferentes doenças, que podem ser eficazes no tratamento do COVID-19.

O uso da China da tecnologia de reconhecimento facial e do software de detecção de temperatura da SenseTime para detectar indivíduos que podem ter febre e podem ter a infecção também ajudou. Uma inovação semelhante capacita os 'capacetes inteligentes' que são utilizados pelas autoridades no território de Sichuan para detectar indivíduos com febre.

Além disso, o governo chinês construiu um sistema de monitoramento chamado Health Code, que emprega big data para identificar e avaliar o risco de cada indivíduo, dependendo de seu histórico de viagens, do tempo gasto em pontos de infecção e exposição potencial a indivíduos com o vírus. . Os moradores recebem um código de cores (vermelho, amarelo ou verde), que podem ser obtidos por meio dos principais aplicativos WeChat ou AliPay para mostrar se devem ser isolados ou autorizados a sair em público.

Ao contrário dos exames médicos que são escassos, caros e geralmente entregues com atrasos, essa abordagem de personalização digital baseada em dados clínicos pode ser aplicada rapidamente e é bastante fácil de dimensionar. Isso permitiria uma alocação de ativos melhor e mais atraente no caso de equipamentos médicos raros, por exemplo, unidades de teste, máscaras de proteção e leitos hospitalares.

Isso poderia nos capacitar com os modelos corretos e permitir uma desquarentena mais segura a uma taxa muito mais rápida do que o permitido pelas atuais melhores práticas segregadas por pista de teste para COVID-19, sob as quais qualquer pessoa infectada e seus contatos permaneceriam em confinamento, independentemente se eles são em geral seguros ou estão apresentando sintomas de doença grave.

Mineração de dados

As informações de mobilidade humana e dados de telecomunicações que foram usados ​​durante o surto de Ebola na África Ocidental e também foram investigados pelo Laboratório de Inovação da UNICEF, Flowminder e outras organizações. O objetivo primário subjacente é compreender as tendências da mobilidade humana em relação às medidas de bloqueio e avaliar o perigo da progressão da doença em uma determinada região.

No terreno, usando um aplicativo do EPI Info Viral Hemorrhagic Fever esta doença pode ser controlada, um programa de código aberto que identifica as pessoas expostas ao vírus e constrói um enorme banco de dados de dados do paciente que incorpora o nome, sexo, idade, localização, histórico e vários outros identificadores.

Na aplicação da análise de big data, a empresa sueca Flowminder utilizou registros telefônicos de 2013 no Senegal para sobrepor surtos anteriores de infecção em padrões de tráfego para prever o movimento e o crescimento do Ebola no país. Embora uma parte significativa da resposta ao Ebola seja estabelecida em infraestrutura física e operações, é claro que a resposta é aumentada pela capacidade de alavancar dados.

Um segundo caminho encorajador é a mineração de dados de mídia social e atividade de mecanismos de busca, que podem mostrar rapidamente onde um surto está ocorrendo. No entanto, os dados de compartilhamento social e consultas de mecanismos de pesquisa podem ser enganosos e não devem ser confiáveis ​​​​exclusivamente. Em vez disso, as organizações de saúde estão consolidando as informações dessas fontes com conjuntos de dados médicos tradicionais e usando a habilidade médica ao dissecar tendências. Daniel Bausch , diretor da equipe de suporte rápido de saúde pública do Reino Unido , vê um potencial incrível nos conjuntos de dados coletados das mídias sociais.

Recentemente, o Laboratório de Big Data do Escritório de Projetos de Estratégia de Desenvolvimento de Nizhny Novgorod desenvolveu um modelo matemático para prever a disseminação do COVID-19. O modelo usou as informações da maioria das nações e distritos que publicaram informações sobre o COVID-19, incluindo 297 regiões do mundo e 21 territórios na Itália.

A equipe observou continuamente pesquisas russas e globais sobre o COVID-19. Isso implica que eles poderiam reunir as informações para o modelo de todos os lugares do mundo, tanto agregadas por nação quanto distribuídas por região e territórios menores. A análise incorporou algumas dezenas de cidades urbanas, a fim de distinguir aquelas que possuem parâmetros epidemiológicos mais próximos dos seus (políticas, tamanho e densidade populacional). O modelo assim desenvolvido auxilia na previsão da pandemia com uma precisão de 2,5%.

Uma abordagem a ser adotada é estabelecer comitês éticos independentes ou trusts de dados. Seu trabalho seria criar mecanismos de governança de dados para descobrir a harmonia entre os interesses públicos em disputa, garantindo a segurança individual.

Leia também: Coisas produtivas para fazer no confinamento

Obtenha a certificação em ciência de dados das melhores universidades do mundo. Aprenda Programas PG Executivos, Programas de Certificado Avançado ou Programas de Mestrado para acelerar sua carreira.

Conclusão

Agora, à medida que desenvolvemos novos avanços que devem coletar, divulgar e utilizar informações para ajudar na batalha contra qualquer pandemia, também precisamos garantir que eles respeitem as melhores práticas éticas. De fato, mesmo em meio a uma emergência, precisamos seguir as diretrizes de segurança de dados e garantir que as informações sejam exploradas de forma ética.

Fazer com que os pioneiros em governos, empresas e serviços médicos confiem nessas ferramentas mudaria fundamentalmente a rapidez com que respondemos a surtos de doenças.

Se você está curioso para aprender sobre ciência de dados, confira o PG Diploma in Data Science do IIIT-B & upGrad, que é criado para profissionais que trabalham e oferece mais de 10 estudos de caso e projetos, workshops práticos práticos, orientação com especialistas do setor, 1- on-1 com mentores do setor, mais de 400 horas de aprendizado e assistência de trabalho com as principais empresas.

Como os motores de busca podem ajudar na prevenção da pandemia?

Os tomadores de decisão podem coletar demandas de usuários e pontos de acesso em tempo real usando big data de mecanismos de pesquisa para auxiliar nas escolhas de prevenção de pandemias. As informações obtidas nas pesquisas podem ser usadas para ajudar a evitar e controlar pandemias, entendendo melhor as demandas dos consumidores durante o surto, alocação de materiais, inovação de produtos pós-pandemia e desenvolvimento do setor. Dados de navegação e mecanismos de pesquisa, como dados de mídia social, são as principais fontes de prevenção de doenças e controlam o big data. Eles não têm nada a ver com terapia médica ou diagnóstico de doenças, mas suas informações prospectivas podem representar a progressão da doença e chamar a atenção das pessoas para certas condições.

Como a tecnologia de análise visual pode contribuir para a prevenção da pandemia?

É possível reconhecer correlações entre grandes conjuntos de dados usando tecnologias de análise visual, permitindo que os investigadores obtenham cognição visual mais intuitiva e ajuda eficiente na tomada de decisões. Atualmente, o governo e os principais formuladores de políticas podem usar as fontes de big data mencionadas acima para realizar uma análise visual do monitoramento da situação pandêmica, recursos médicos, empresas hospitalares e triagem de contatos próximos para fazer escolhas. Todos os governos usam análises visuais de big data para visualizar indicadores críticos de COVID, como dados de casos, dispersão de vírus, tendências de situação de pandemia e relatórios de pontos de acesso em tempo real. A tecnologia pode cumprir o direito do público de saber o máximo possível e permite que os formuladores de políticas tenham uma compreensão abrangente da situação da pandemia e ajudem na tomada de decisões científicas.

Que papel a PNL pode desempenhar na prevenção da pandemia?

Um governo pode melhorar a precisão do reconhecimento de fala usando aprendizado profundo para processamento de linguagem natural (NLP). Esse reconhecimento inclui reconhecimento de entidade, categorização automatizada de texto de material sensível, documentos, relatórios, notícias e assim por diante. Para monitorar as atitudes do público na Internet, sistemas de alerta precoce, mecanismos de comunicação de informações, mineração de rumores, análise da maré da opinião pública e apaziguamento público, essas informações podem ser obtidas através da Internet e de plataformas de redes sociais. A tecnologia de processamento de linguagem natural (NLP) pode ajudar com alerta precoce, disseminação de rumores, rastreamento de dinâmicas de doenças, pontos de acesso social e impulso de informações na prevenção e controle de pandemias.