Что может сделать наука о данных, чтобы помочь предотвратить пандемии в будущем?
Опубликовано: 2020-05-19В настоящее время мы сталкиваемся с глобальной чрезвычайной ситуацией. С точки зрения общественного здравоохранения, чтобы бороться с эпидемией, власти должны предпринимать различные действия, например, обеспечивать эффективную осведомленность, устанавливать руководящие принципы для экспертов в области здравоохранения, нацеливаться на кластеры заражения, ограничивать развитие населения и распределять ограниченные ресурсы.
Быстрая и точная аналитика данных, которая может точно определить вспышки и предвидеть движение, имеет решающее значение для борьбы с непреодолимыми инфекциями. Исторические методологии, такие как отчеты следователей и больничные записи, надежны, но в лучшем случае посредственны в прогнозировании. Растет убеждение, что более современные методологии, включая отслеживание сотовых телефонов и интеллектуальный анализ данных поисковых систем и социальных сетей, могут помочь дать более быструю и все более точную картину того, где развиваются болезни и где они могут распространиться дальше.
Наука о данных может сыграть важную роль в анализе крупномасштабного тестирования людей, связав эти результаты с анонимными характеристиками здоровья госпитализированных пациентов. Это позволит нам понять ключевые факторы риска и лучше защитить людей, подвергающихся наибольшему риску заражения. Чем больше информации, тем точнее могут быть эти прогнозы.
Оглавление
Сила предсказания
Инновации в прогнозировании изменили многие предприятия за последние 20 лет. Такие организации, как BlueDot и Metabiota, используют ряд алгоритмов обработки естественного языка (NLP) для просмотра новостных выпусков и официальных медицинских отчетов на разных языках по всему миру. Их прогностические устройства также могут использовать информацию о авиаперелетах для оценки риска того, что транзитные узлы могут увидеть зараженных людей, которые либо появляются, либо уходят.
Используя различные источники больших данных, модели машинного обучения можно обучить для количественной оценки клинического риска развития тяжелого заболевания у человека в случае заражения серьезной инфекцией, такой как COVID-19: какова вероятность того, что ему потребуется специализированная помощь, для чего активы ограничены? Какова вероятность того, что они поддадутся болезни? Такие данные могут включать фундаментальные истории болезни людей.
Результаты разумно точны. Например, в последнем публичном отчете Metabiota от 25 февраля предполагалось, что 3 марта в мире будет зарегистрировано 1 27 000 случаев COVID-19 . Это число было превышено примерно на 30 000, но Марк Галливан, тогдашний директор по науке о данных компании, сказал, что это все еще находится в пределах допустимой погрешности. Кроме того, были зарегистрированы страны, которые, скорее всего, сообщат о новых случаях, включая Китай, Италию, Иран и Соединенные Штаты Америки.
Система искусственного интеллекта Google DeepMind используется для различения атрибутов вируса, что может помочь понять, как он функционирует. Эти данные могут оказаться полезными при определении того, какие лекарства искать. Другие использовали технологию, разработанную британским стартапом в области биоинформатики BenevolentAI, который использует искусственный интеллект для поиска многообещающих существующих методов лечения различных заболеваний, которые могут быть эффективными при лечении COVID-19.
Использование Китаем технологии распознавания лиц SenseTime и программного обеспечения для определения температуры для выявления лиц, у которых может быть лихорадка и которые могут быть связаны с инфекцией, также помогло. Аналогичное новшество приводит в действие «умные шлемы», которые используются властями на территории провинции Сычуань для обнаружения людей с лихорадкой.
Правительство Китая дополнительно создало систему мониторинга под названием «Кодекс здоровья», которая использует большие данные для выявления и оценки риска каждого человека в зависимости от его истории поездок, количества времени, которое они провели в горячих точках заражения, и потенциального контакта с людьми, зараженными вирусом. . Жителям присваивается цветовой код (красный, желтый или зеленый), который они могут получить с помощью основных приложений WeChat или AliPay, чтобы показать, должны ли они быть изолированы или им разрешено выходить на улицу.
В отличие от медицинских тестов, которые являются дефицитными, дорогостоящими и часто доставляются с задержками, этот подход к цифровой персонализации, основанный на клинических данных, можно применять быстро и довольно легко масштабировать. Это позволило бы лучше и привлекательнее распределять активы в случае редкого медицинского оборудования, например, тестовые блоки, защитные маски и больничные койки.
Это может дать нам правильные модели и обеспечить более безопасное снятие карантина с гораздо более высокой скоростью, чем это допускается текущими передовыми методами тестирования COVID-19, в соответствии с которыми любой инфицированный и его контакты останутся в заключении, независимо от того, являются ли они в целом безопасными или проявляют симптомы тяжелого заболевания.
Добыча данных
Информация о мобильности людей и телекоммуникационные данные, которые использовались во время вспышки лихорадки Эбола в Западной Африке и дополнительно исследовались Лабораторией инноваций ЮНИСЕФ, Flowminder и другими организациями. Основная основная цель состоит в том, чтобы понять тенденции мобильности людей в связи с мерами изоляции и оценить опасность прогрессирования заболевания в конкретном регионе.
На земле с помощью приложения EPI Info Viral Hemorrhagic Fever this Disease можно контролировать, программы с открытым исходным кодом, которая идентифицирует тех, кто подвергся воздействию вируса, и создает огромную базу данных данных о пациентах, которая включает имя, пол, возраст, местонахождение, медицинское состояние. история и множество других идентификаторов.

Применяя аналитику больших данных, шведская фирма Flowminder использовала записи телефонных разговоров в Сенегале за 2013 год, чтобы наложить прошлые вспышки инфекции на модели трафика, чтобы предвидеть движение и рост лихорадки Эбола в стране. Хотя значительная часть мер реагирования на Эболу обеспечивается физической инфраструктурой и операциями, ясно, что меры реагирования дополняются возможностью использовать данные.
Второй обнадеживающий путь — это интеллектуальный анализ данных активности социальных сетей и поисковых систем, который может быстро показать, где происходит вспышка. Однако данные из социальных сетей и запросов поисковых систем могут вводить в заблуждение, и им не следует доверять исключительно. Скорее, организации здравоохранения объединяют информацию из этих источников с традиционными наборами медицинских данных и используют медицинские возможности при анализе тенденций. Дэниел Бауш , директор Группы оперативной поддержки общественного здравоохранения Великобритании , видит невероятный потенциал в наборах данных, собранных из социальных сетей.
Недавно Лаборатория больших данных Нижегородского проектного офиса стратегии развития разработала математическую модель для прогнозирования распространения COVID-19. В модели использовалась информация о большинстве стран и районов, опубликовавших информацию о COVID-19, включая 297 регионов мира и 21 территорию в Италии.
Команда постоянно наблюдала за российскими и глобальными исследованиями COVID-19. Это означает, что они могут собирать информацию для модели со всего мира, как агрегированную по странам, так и распределенную по регионам и меньшим территориям. В анализ были включены несколько десятков городских городов, чтобы выделить те, у которых эпидемиологические параметры наиболее близки к их собственным (политика, численность и плотность населения). Разработанная таким образом модель помогает прогнозировать пандемию с точностью до 2,5%.
Один из возможных подходов — создать независимые комитеты по этике или фонды данных. Их работа будет заключаться в создании механизмов управления данными, чтобы найти гармонию между конкурирующими общественными интересами и обеспечить личную безопасность.
Читайте также: Чем продуктивно заняться в условиях самоизоляции
Получите сертификат по науке о данных от лучших университетов мира. Изучите программы Executive PG, Advanced Certificate Programs или Master Programs, чтобы ускорить свою карьеру.
Заключение
Теперь, когда мы разрабатываем новые достижения, которые, как ожидается, будут собирать, распространять и использовать информацию, чтобы помочь в борьбе с любой пандемией, нам также необходимо обеспечить, чтобы они соблюдали передовой этический опыт. Действительно, даже в условиях чрезвычайной ситуации мы должны следовать правилам безопасности данных и гарантировать, что информация используется этично.
Доверие пионеров в правительствах, компаниях и медицинских службах к этим инструментам коренным образом изменит нашу скорость реагирования на вспышки заболеваний.
Если вам интересно узнать о науке о данных, ознакомьтесь с дипломом IIIT-B & upGrad PG в области науки о данных, который создан для работающих профессионалов и предлагает более 10 тематических исследований и проектов, практические семинары, наставничество с отраслевыми экспертами, 1- on-1 с отраслевыми наставниками, более 400 часов обучения и помощи в трудоустройстве в ведущих фирмах.
Как поисковые системы могут помочь в предотвращении пандемии?
Лица, принимающие решения, могут собирать запросы пользователей и горячие точки в режиме реального времени, используя большие данные из поисковых систем, чтобы помочь в выборе вариантов предотвращения пандемии. Информация, полученная в результате поиска, может быть использована для предотвращения и контроля пандемий за счет лучшего понимания потребностей потребителей во время вспышки, распределения материалов, инноваций в продуктах после пандемии и развития отрасли. Навигационные и поисковые данные, такие как данные социальных сетей, являются основными источниками профилактики заболеваний, и они контролируют большие данные. Они не имеют ничего общего с медикаментозной терапией или диагностикой заболеваний, но их проспективная информация может отражать прогрессирование заболевания и привлекать внимание людей к определенным состояниям.
Как технология визуального анализа может способствовать предотвращению пандемии?
Можно распознавать корреляции между большими наборами данных с помощью технологий визуального анализа, что позволяет исследователям получить более интуитивное визуальное познание и эффективную помощь в принятии решений. В настоящее время правительство и ключевые политики могут использовать вышеупомянутые источники больших данных для проведения визуального анализа мониторинга ситуации с пандемией, медицинских ресурсов, больничных предприятий и скрининга близких контактов, чтобы сделать выбор. Все правительства используют визуальный анализ больших данных для визуализации критически важных показателей COVID, таких как данные о случаях заболевания, распространение вируса, тенденции ситуации с пандемией и отчеты о горячих точках в режиме реального времени. Эта технология может в максимально возможной степени реализовать право общественности на информацию и позволяет политикам получить всестороннее представление о ситуации с пандемией и помочь в принятии научных решений.
Какую роль может сыграть НЛП в предотвращении пандемии?
Правительство может повысить точность распознавания речи, используя глубокое обучение для обработки естественного языка (NLP). Такое распознавание включает в себя распознавание сущностей, автоматическую категоризацию текста конфиденциальных материалов, документов, отчетов, новостей и т. д. Для мониторинга общественного мнения в Интернете, систем раннего предупреждения, механизмов передачи информации, сбора слухов, анализа общественного мнения и общественного умиротворения эта информация может быть получена через Интернет и платформы социальных сетей. Технология обработки естественного языка (NLP) может помочь в раннем предупреждении, распространении слухов, отслеживании динамики заболевания, социальных горячих точках и информационном продвижении в предотвращении и контроле пандемии.