데이터 과학은 미래에 유행병을 예방하기 위해 무엇을 할 수 있습니까?

게시 됨: 2020-05-19

우리는 현재 전 세계적인 비상 사태에 직면해 있습니다. 공중 보건의 관점에서 전염병과 싸우기 위해 당국은 효과적인 인식 제고, 보건 전문가를 위한 지침 설정, 오염 클러스터 표적화, 인구 개발 제한, 희소 자원 할당과 같은 다양한 조치를 취해야 합니다.

발병을 정확히 찾아내고 움직임을 예측할 수 있는 빠르고 정확한 데이터 분석은 저항할 수 없는 감염과 싸우는 데 매우 중요합니다. 조사자 보고서 및 병원 기록과 같은 역사적 방법론은 신뢰할 수 있지만 예측에 있어서는 보통 수준입니다. 휴대전화 추적, 검색 엔진의 데이터 마이닝, 소셜 미디어를 비롯한 최신 방법론이 질병이 어디에서 퍼지고 다음으로 퍼질 수 있는지에 대한 더 빠르고 점진적으로 정제된 그림을 제공하는 데 도움이 될 수 있다는 믿음이 커지고 있습니다.

데이터 과학은 이러한 결과를 입원 환자의 익명화된 건강 속성과 연결하여 개인에 대한 대규모 테스트를 분석하는 데 중요한 역할을 할 수 있습니다. 이를 통해 우리는 주요 위험 요소를 이해하고 감염 위험이 가장 높은 개인을 더 잘 보호할 수 있습니다. 정보가 많을수록 이러한 예측이 더 정확해질 수 있습니다.

예측의 힘

예측의 혁신은 지난 20년 동안 수많은 기업을 변화시켰습니다. BlueDot 및 Metabiota와 같은 조직은 다양한 자연어 처리(NLP) 알고리즘을 활용하여 전 세계 다양한 언어로 뉴스 매체 및 공식 의료 보고서를 선별합니다. 그들의 예측 장치는 마찬가지로 항공 여행 정보를 활용하여 환승 허브가 오염된 개인이 나타나거나 떠나는 것을 볼 수 있는 위험을 조사할 수 있습니다.

다양한 빅 데이터 소스를 활용하는 머신 러닝 모델은 COVID-19와 같은 심각한 감염에 걸릴 경우 심각한 질병에 걸릴 임상 위험을 정량화하도록 훈련될 수 있습니다. 제한된? 그들이 질병에 걸릴 가능성은 얼마나 됩니까? 그러한 데이터는 사람들의 기본적인 의료 기록을 통합할 수 있습니다.

결과는 현명하게 정확합니다. 예를 들어, 2월 25일 Metabiota의 가장 최근 공개 보고서에서는 3월 3일 에 전 세계적으로 총 1,27,000명의 COVID-19 사례가 발생할 것으로 예상했습니다. 이 수치는 약 30,000명 정도 초과되었지만 당시 회사 데이터 과학 이사인 Mark Gallivan은 이것이 여전히 오류의 여지가 있다고 말했습니다. 중국, 이탈리아, 이란, 미국 등 신규 확진자가 가장 많을 것으로 예상되는 국가도 추가로 기록했다.

Google의 DeepMind AI 시스템은 바이러스의 속성을 구별하는 데 사용되며, 이는 바이러스가 작동하는 방식을 이해하는 데 도움이 될 수 있습니다. 이 데이터는 찾아야 할 약을 결정하는 데 도움이 될 것입니다. 다른 사람들은 인공 지능을 사용하여 COVID-19 치료에 효과적일 수 있는 다양한 질병에 대한 유망한 기존 치료법을 찾는 영국 기반 생물 정보학 스타트업 BenevolentAI가 개발한 기술을 통합했습니다.

중국이 열이 있고 감염될 가능성이 있는 개인을 감지하기 위해 SenseTime의 안면 인식 기술과 온도 감지 소프트웨어를 사용한 것도 도움이 되었습니다. 유사한 혁신이 쓰촨 지역의 당국이 발열 환자를 감지하는 데 사용하는 '스마트 헬멧'에 동력을 제공합니다.

중국 정부는 여행 이력, 감염 핫스팟에서 보낸 시간, 바이러스에 감염된 개인에 대한 잠재적 노출에 따라 모든 개인의 위험을 식별하고 평가하기 위해 빅 데이터를 사용하는 Health Code라는 모니터링 시스템을 추가로 구축했습니다. . 거주자에게는 색상 코드(빨간색, 노란색 또는 녹색)가 할당되며, 이 코드는 주요 응용 프로그램인 WeChat 또는 AliPay를 통해 얻을 수 있으므로 격리되어야 하는지 아니면 대중에게 나가도록 허용되어야 하는지 여부를 표시할 수 있습니다.

드물고 비용이 많이 들고 종종 지연되는 의료 테스트와 달리 이 임상 데이터 기반 디지털 개인화 접근 방식은 신속하게 적용할 수 있고 확장이 매우 쉽습니다. 검사 장치, 보호 마스크 및 병상과 같은 희귀 의료 장비의 경우 더 우수하고 매력적인 자산 할당이 가능합니다.

올바른 모델을 제공하고 COVID-19에 대한 현재 테스트 트랙 분리 모범 사례에서 허용하는 것보다 훨씬 빠른 속도로 더 안전한 격리 해제를 가능하게 할 수 있습니다. 그들이 일반적으로 안전한지 또는 심각한 질병의 증상을 보이는지 여부.

데이터 마이닝

서아프리카에서 에볼라가 유행할 때 활용되어 유니세프 이노베이션 랩, 플로우마인더 등 여러 기관에서 추가로 조사한 인간의 이동성 정보와 통신 데이터. 기본 주요 목표는 잠금 조치와 관련하여 인간의 이동 경향을 이해하고 특정 지역에서 진행되는 질병의 위험을 평가하는 것입니다.

현장에서 EPI Info Viral Hemorrhagic Fever의 응용 프로그램을 사용하여 이 질병은 바이러스에 노출된 사람을 식별하고 이름, 성별, 나이, 위치, 의료 정보를 포함하는 방대한 환자 데이터 데이터베이스를 구축하는 오픈 소스 프로그램인 제어할 수 있습니다. 역사 및 기타 수많은 식별자.

빅 데이터 분석을 적용할 때 스웨덴 회사인 Flowminder는 2013년 세네갈의 전화 기록을 활용하여 과거 감염 발생을 교통 패턴에 겹쳐서 국가 내 에볼라의 움직임과 성장을 예측했습니다. 에볼라에 대한 대응의 상당 부분이 물리적 인프라 및 운영에서 이루어지지만 데이터를 활용하는 능력으로 대응이 강화된다는 것은 분명합니다.

두 번째 고무적인 방법은 소셜 미디어 및 검색 엔진 활동의 데이터 마이닝으로, 발병이 발생한 위치를 신속하게 보여줄 수 있습니다. 그러나 소셜 공유 및 검색 엔진 쿼리의 데이터는 오해의 소지가 있으므로 전적으로 신뢰할 수 없습니다. 오히려 의료 기관은 이러한 소스의 정보를 기존 의료 데이터 세트와 통합하고 추세를 분석할 때 의료 능력을 사용합니다. 영국 공중 보건 신속 지원 팀의 이사인 Daniel Bausch 는 소셜 미디어에서 수집한 데이터 세트의 놀라운 잠재력을 보고 있습니다.

최근 Nizhny Novgorod Development Strategy Project Office의 빅 데이터 연구소는 COVID-19의 확산을 예측하는 수학적 모델을 개발했습니다. 이 모델은 전 세계 297개 지역과 이탈리아 21개 지역을 포함하여 COVID-19 통찰력을 발표한 대부분의 국가 및 지역에 대한 정보를 사용했습니다.

팀은 COVID-19에 대한 러시아 및 글로벌 연구를 지속적으로 관찰했습니다. 이는 국가별로 집계되고 지역 및 소규모 지역별로 분포된 전 세계 모든 곳에서 모델에 대한 정보를 수집할 수 있음을 의미합니다. 분석은 자체에 가장 가까운 역학적 매개변수(정책, 인구 규모 및 밀도)를 가진 도시를 구별하기 위해 수십 개의 도시 도시를 통합했습니다. 이렇게 개발된 모델 은 2.5%의 정확도로 전염병을 예측하는 데 도움이 됩니다.

채택할 한 가지 접근 방식은 독립적인 윤리 위원회 또는 데이터 트러스트를 설정하는 것입니다. 그들의 임무는 개인의 보안을 보장하면서 경합하는 공익 사이의 조화를 발견하기 위한 데이터 거버넌스 메커니즘을 만드는 것입니다.

더 읽어보기: 폐쇄 상태에서 해야 할 생산적인 일

세계 최고의 대학에서 데이터 과학 인증 을 받으십시오 . 이그 제 큐 티브 PG 프로그램, 고급 인증 프로그램 또는 석사 프로그램을 통해 경력을 빠르게 추적하십시오.

결론

이제 우리는 전염병 퇴치를 돕기 위해 정보를 수집, 보급 및 활용할 것으로 예상되는 새로운 발전을 개발함에 따라 윤리적 모범 사례를 존중하도록 해야 합니다. 실제로 긴급 상황에서도 데이터 보안 지침을 따라야 하며 정보가 윤리적으로 악용되고 있음을 보장해야 합니다.

정부, 기업 및 의료 서비스의 선구자들이 이러한 도구를 신뢰하도록 하면 질병 발생에 신속하게 대응하는 방식이 근본적으로 바뀔 것입니다.

데이터 과학에 대해 자세히 알아보려면 IIIT-B & upGrad의 데이터 과학 PG 디플로마를 확인하세요. 이 PG 디플로마는 실무 전문가를 위해 만들어졌으며 10개 이상의 사례 연구 및 프로젝트, 실용적인 실습 워크숍, 업계 전문가와의 멘토링, 1- 업계 멘토와 일대일, 400시간 이상의 학습 및 최고의 기업과의 취업 지원.

검색 엔진이 전염병 예방에 어떻게 도움이 됩니까?

의사 결정자는 검색 엔진의 빅 데이터를 사용하여 실시간으로 사용자 요구와 핫스팟을 수집하여 전염병 예방 선택을 지원할 수 있습니다. 검색을 통해 얻은 정보는 발병, 물질 할당, 팬데믹 이후 제품 혁신 및 산업 개발 중 소비자 요구를 더 잘 이해함으로써 팬데믹을 피하고 통제하는 데 도움이 될 수 있습니다. 탐색 및 검색엔진 데이터는 소셜미디어 데이터와 같이 질병 예방의 주요 원천이며 빅데이터를 통제한다. 그것들은 의학적 치료나 질병 진단과는 아무 관련이 없지만, 그들의 예상 정보는 질병의 진행을 나타내고 사람들의 주의를 특정 상태에 끌 수 있습니다.

시각적 분석 기술이 전염병 예방에 어떻게 기여할 수 있습니까?

시각적 분석 기술을 사용하여 대규모 데이터 세트 간의 상관 관계를 인식할 수 있어 조사관이 보다 직관적인 시각적 인지와 효율적인 의사 결정에 도움을 받을 수 있습니다. 현재 정부와 주요 정책 입안자들은 앞서 언급한 빅 데이터 소스를 사용하여 전염병 상황 모니터링, 의료 자원, 병원 기업 및 밀접 접촉 선별에 대한 시각적 분석을 수행하여 선택을 할 수 있습니다. 모든 정부는 빅 데이터의 시각적 분석을 사용하여 사례 데이터, 바이러스 확산, 전염병 상황 동향 및 핫스팟 보고서와 같은 중요한 COVID 지표를 실시간으로 시각화합니다. 이 기술은 대중의 알 권리를 최대한 실현할 수 있으며 정책 입안자들이 전염병 상황을 포괄적으로 이해하고 과학적 의사 결정에 도움을 줄 수 있습니다.

NLP는 전염병 예방에 어떤 역할을 할 수 있습니까?

정부는 NLP(자연어 처리)에 딥 러닝을 사용하여 음성 인식 정확도를 향상시킬 수 있습니다. 이러한 인식에는 엔티티 인식, 민감한 자료의 자동화된 텍스트 분류, 논문, 보고서, 뉴스 등이 포함됩니다. 인터넷, 조기 경보 시스템, 정보 통신 메커니즘, 루머 마이닝, 여론 분석의 조류 및 대중 유화에 대한 대중의 태도를 모니터링하기 위해 이 정보는 인터넷 및 소셜 네트워킹 플랫폼을 통해 얻을 수 있습니다. 자연어 처리(NLP) 기술은 조기 경고, 소문 유포, 질병 역학 추적, 사회적 핫스팟, 팬데믹 예방 및 통제에 대한 정보 푸시에 도움이 될 수 있습니다.