将来のパンデミックを防ぐためにデータサイエンスは何ができるでしょうか?

公開: 2020-05-19

私たちは現在、世界的な緊急事態に直面しています。 公衆衛生の観点から、エピデミックと戦うために、当局はさまざまな行動をとる必要があります。たとえば、効果的な認識の作成、健康専門家向けのガイドラインの設定、汚染クラスターの標的化、人口増加の制限、希少な資源の割り当てなどです。

発生を特定し、動きを予測できる迅速で正確なデータ分析は、魅力的な感染症と戦うために重要です。 調査員の報告や病院の記録などの歴史的方法論は、信頼性はありますが、予測はせいぜい中程度です。 携帯電話の追跡や検索エンジンのデータマイニング、ソーシャルメディアなど、現在の方法論は、病気がどこに広がり、次にどこに広がる可能性があるかを、より迅速に、徐々に洗練された形で示すのに役立つとの信念が高まっています。

データサイエンスは、これらの結果を入院患者の匿名化された健康属性と結び付けることにより、個人の大規模なテストを分解する上で重要な役割を果たすことができます。 これにより、主要なリスク要因を理解し、感染のリスクが最も高い個人をより適切に保護できるようになります。 情報が多ければ多いほど、これらの予測はより正確になる可能性があります。

目次

予測の力

予測の革新は、過去20年間で多くの企業を変えました。 BlueDotやMetabiotaのような組織は、自然言語処理(NLP)アルゴリズムの範囲を利用して、世界中のさまざまな言語で報道機関や公式の医療レポートを選別しています。 彼らの予測装置は、同様に空の旅の情報を利用して、交通ハブが汚染された個人が現れたり離れたりするのを見る可能性があるリスクを調査することができます。

ビッグデータのさまざまなソースを利用して、機械学習モデルをトレーニングして、COVID-19などの重篤な感染症にかかった場合に重篤な疾患を発症する人の臨床リスクを定量化することができます。制限がありますか? 彼らは病気に屈する可能性はどのくらいありますか? このようなデータには、人々の基本的な病歴を組み込むことができます。

結果はかなり正確です。 たとえば、2月25日のMetabiotaの最新の公開レポートでは、3月3日に世界中で合計1,27,000件のCOVID-19症例が発生すると予測されていました。 この数は約30,000を超えましたが、当時のデータサイエンスディレクターであったMark Gallivanは、これはまだ間違いの余地があると述べています。 さらに、中国、イタリア、イラン、アメリカ合衆国など、新しい症例を報告する可能性が最も高い国を記録しました。

GoogleのDeepMindAIシステムは、ウイルスの属性を区別するために使用されており、ウイルスがどのように機能するかを理解するのに役立つ可能性があります。 このデータは、どの薬を探すべきかを決定するのに役立つことがわかります。 英国を拠点とするバイオインフォマティクスのスタートアップBenevolentAIが開発した技術を取り入れた企業もあります。この技術は、人工知能を使用して、COVID-19の治療に効果的なさまざまな疾患の有望な既存の治療法を見つけています。

中国がSenseTimeの顔認識技術と温度検出ソフトウェアを使用して、発熱している可能性があり、感染している可能性のある個人を検出することも役立ちました。 同様の革新は、発熱のある個人を検出するために四川地域の当局によって利用されている「スマートヘルメット」に力を与えています。

中国政府はさらに、ビッグデータを使用して、旅行履歴、感染ホットスポットで過ごした時間、およびウイルスに感染した個人への潜在的な曝露に応じて、すべての個人のリスクを特定および評価するHealthCodeと呼ばれる監視システムを構築しました。 。 居住者にはカラーコード(赤、黄、または緑)が割り当てられ、主流のアプリケーションであるWeChatまたはAliPayを使用して取得し、隔離するか、公共の場に出かけることを許可するかを示すことができます。

希少で費用がかかり、遅れて提供されることが多い医療検査とは異なり、この臨床データ主導のデジタルパーソナライズアプローチは迅速に適用でき、拡張が非常に簡単です。 これにより、テストユニット、保護マスク、病院のベッドなどの希少な医療機器の場合に、より適切で魅力的な資産配分が可能になります。

それは正しいモデルで私たちに力を与え、COVID-19の現在のテストトラックで分離されたベストプラクティスによって許可されるよりもはるかに速い速度でより安全な隔離解除を可能にする可能性があります。それらが一般的に安全であるか、または重度の病気の症状を示しているかどうかの。

データのマイニング

西アフリカでのエボラ出血熱の発生時に利用され、さらにユニセフイノベーションラボ、フローマインダー、およびその他の組織によって調査された、人間の移動に関する情報と通信データ。 根本的な主な目的は、封鎖措置に関する人間の移動傾向を理解し、特定の地域で病気が進行する危険性を評価することです。

地上では、EPI情報ウイルス出血熱のアプリケーションを使用することにより、この病気は制御できます。これは、ウイルスにさらされた人を特定し、名前、性別、年齢、場所、医療を組み込んだ患者データの巨大なデータベースを構築するオープンソースプログラムです。履歴と他の多数の識別子。

ビッグデータ分析の適用において、スウェーデンの会社名Flowminderは、セネガルでの2013年の電話記録を利用して、過去の感染の発生を交通パターンに重ね合わせ、国内でのエボラ出血熱の移動と成長を予測しました。 エボラ出血熱への対応の重要な部分は物理的なインフラストラクチャと運用で確立されていますが、データを活用する機能によって対応が強化されていることは明らかです。

2つ目の有望な道は、ソーシャルメディアと検索エンジンの活動のデータマイニングです。これにより、発生が発生している場所を迅速に示すことができます。 ただし、ソーシャル共有および検索エンジンクエリからのデータは誤解を招く可能性があり、排他的に信頼されるべきではありません。 むしろ、医療機関はこれらの情報源からの情報を従来の医療データセットと統合し、傾向を分析する際に医療能力を使用しています。 UK Public Health Rapid SupportTeamのディレクターであるDanielBauschは、ソーシャルメディアから収集されたデータセットに信じられないほどの可能性があると考えています。

最近、ニジニノヴゴロド開発戦略プロジェクトオフィスのビッグデータ研究所は、COVID-19の蔓延を予測するための数学的モデルを開発しました。 このモデルでは、世界の297の地域とイタリアの21の地域を含む、COVID-19の洞察を公開しているほとんどの国と地区の情報を使用しました。

チームは、COVID-19に関するロシアおよび世界的な研究を継続的に観察しました。 これは、モデルの情報を世界中のどこからでも収集できることを意味します。国ごとに集計され、地域や小さな地域ごとに配布されます。 分析には、自分たちに最も近い疫学的パラメーター(政策、人口規模、密度)を持つ都市を区別するために、数十の都市が組み込まれました。 そのように開発されたモデルは、2.5%の精度でパンデミックを予測するのに役立ちます。

採用するアプローチの1つは、独立した倫理委員会またはデータトラストを設置することです。 彼らの仕事は、個人の安全を確保しながら、対立する公益の間の調和を発見するためのデータガバナンスメカニズムを作成することです。

また読む:封鎖で行う生産的なこと

世界のトップ大学からデータサイエンス認定取得します。 エグゼクティブPGプログラム、高度な証明書プログラム、または修士プログラムを学び、キャリアを早急に進めましょう。

結論

現在、パンデミックとの闘いに役立つ情報を収集、普及、活用することが期待される新しい進歩を開発するにつれ、倫理的なベストプラクティスを尊重するようにする必要もあります。 実際、緊急事態の中でも、データセキュリティガイドラインに従い、情報が倫理的に悪用されていることを保証する必要があります。

政府、企業、医療サービスのパイオニアにこれらのツールを信頼してもらうことで、病気の発生への対応の速さを根本的に変えることができます。

データサイエンスについて知りたい場合は、IIIT-BとupGradのデータサイエンスのPGディプロマをチェックしてください。これは、働く専門家向けに作成され、10以上のケーススタディとプロジェクト、実践的なハンズオンワークショップ、業界の専門家とのメンターシップ、1- on-1業界のメンター、400時間以上の学習、トップ企業との仕事の支援。

検索エンジンはパンデミックの予防にどのように役立ちますか?

意思決定者は、検索エンジンからのビッグデータを使用してユーザーの要求とホットスポットをリアルタイムで収集し、パンデミック防止の選択を支援できます。 検索から得られた情報は、発生時の消費者の需要、材料の割り当て、パンデミック後の製品革新、および業界の発展をよりよく理解することにより、パンデミックを回避および制御するために使用できます。 ソーシャルメディアデータのようなナビゲーションと検索エンジンのデータは、病気の予防の主要な情報源であり、ビッグデータを管理します。 それらは医学療法や病気の診断とは何の関係もありませんが、それらの将来の情報は病気の進行を表し、特定の状態に人々の注意を引くことができます。

視覚分析技術はパンデミック予防にどのように貢献できますか?

視覚分析技術を使用して大規模なデータセット間の相関関係を認識することが可能であり、研究者はより直感的な視覚認識と効率的な意思決定の支援を得ることができます。 現在、政府と主要な政策立案者は、前述のビッグデータソースを使用して、パンデミック状況の監視、医療リソース、病院企業、および緊密な連絡先のスクリーニングを視覚的に分析して選択を行うことができます。 すべての政府は、ビッグデータの視覚的分析を使用して、ケースデータ、ウイルスの分散、パンデミック状況の傾向、ホットスポットレポートなどの重要なCOVID指標をリアルタイムで視覚化します。 このテクノロジーは、国民の知る権利を最大限に発揮することができ、政策立案者がパンデミックの状況を包括的に理解し、科学的な意思決定を支援することを可能にします。

パンデミックの予防においてNLPはどのような役割を果たすことができますか?

政府は、自然言語処理(NLP)に深層学習を使用することにより、音声認識の精度を向上させる可能性があります。 このような認識には、エンティティの認識、機密資料、論文、レポート、ニュースなどの自動テキスト分類が含まれます。 インターネット上の一般市民の態度、早期警告システム、情報通信メカニズム、噂の採掘、世論分析の流れ、および一般市民の宥和を監視するために、この情報はインターネットおよびソーシャルネットワーキングプラットフォームを介して取得できます。 自然言語処理(NLP)テクノロジーは、早期警告、噂の普及、病気のダイナミクスの追跡、社会的なホットスポット、およびパンデミックの予防と制御における情報のプッシュに役立ちます。