Data Science สามารถช่วยป้องกันโรคระบาดในอนาคตได้อย่างไร?

เผยแพร่แล้ว: 2020-05-19

ขณะนี้เรากำลังเผชิญกับภาวะฉุกเฉินทั่วโลก จากมุมมองด้านสาธารณสุข ในการต่อสู้กับโรคระบาด ทางการต้องดำเนินการหลายอย่าง เช่น การสร้างความตระหนักรู้ที่มีประสิทธิภาพ การกำหนดแนวทางสำหรับผู้เชี่ยวชาญด้านสุขภาพ การกำหนดเป้าหมายกลุ่มการปนเปื้อน การจำกัดการพัฒนาประชากร และการจัดสรรทรัพยากรที่ขาดแคลน

การวิเคราะห์ข้อมูลที่รวดเร็วและแม่นยำซึ่งสามารถระบุการระบาดและคาดการณ์การเคลื่อนไหวได้มีความสำคัญต่อการต่อสู้กับการติดเชื้อที่ไม่อาจต้านทานได้ วิธีการในอดีต เช่น รายงานของผู้วิจัยและบันทึกของโรงพยาบาล เชื่อถือได้แต่พอประมาณในการพยากรณ์ได้ดีที่สุด มีความเชื่อเพิ่มมากขึ้นว่าระเบียบวิธีที่เป็นปัจจุบันมากขึ้น รวมถึงการติดตามโทรศัพท์มือถือและการทำเหมืองข้อมูลของเสิร์ชเอ็นจิ้น และโซเชียลมีเดีย สามารถช่วยให้เห็นภาพว่าโรคภัยไข้เจ็บเกิดขึ้นที่ใดและจะแพร่กระจายไปที่ใดในลำดับต่อไปอย่างรวดเร็วและละเอียดยิ่งขึ้น

วิทยาศาสตร์ข้อมูลสามารถมีบทบาทสำคัญในการทำลายการทดสอบในวงกว้างของบุคคลโดยเชื่อมโยงผลลัพธ์เหล่านี้กับคุณลักษณะด้านสุขภาพที่ไม่เปิดเผยชื่อของผู้ป่วยที่เข้ารับการรักษาในโรงพยาบาล ซึ่งจะช่วยให้เราเข้าใจปัจจัยเสี่ยงที่สำคัญและปกป้องบุคคลที่มีความเสี่ยงสูงที่จะติดเชื้อได้ดีขึ้น ยิ่งมีข้อมูลมากเท่าใด การคาดการณ์เหล่านี้ก็จะยิ่งแม่นยำมากขึ้นเท่านั้น

สารบัญ

พลังแห่งการทำนาย
การขุดเพื่อข้อมูล
บทสรุป
เสิร์ชเอ็นจิ้นจะช่วยป้องกันการแพร่ระบาดได้อย่างไร?
เทคโนโลยีการวิเคราะห์ด้วยภาพจะช่วยป้องกันการแพร่ระบาดได้อย่างไร
NLP มีบทบาทอย่างไรในการป้องกันการแพร่ระบาด?

พลังแห่งการทำนาย

นวัตกรรมการคาดการณ์ได้เปลี่ยนแปลงองค์กรจำนวนมากในช่วง 20 ปีที่ผ่านมา องค์กรต่างๆ เช่น BlueDot และ Metabiota ใช้ขอบเขตของอัลกอริธึมการประมวลผลภาษาธรรมชาติ (NLP) เพื่อคัดกรองแหล่งข่าวและรายงานด้านสุขภาพอย่างเป็นทางการในภาษาต่างๆ ทั่วโลก อุปกรณ์คาดการณ์ของพวกเขายังสามารถดึงข้อมูลการเดินทางทางอากาศเพื่อสำรวจความเสี่ยงที่ฮับขนส่งอาจเห็นบุคคลที่ปนเปื้อนปรากฏขึ้นหรือออกไป

การใช้แหล่งข้อมูลขนาดใหญ่ที่แตกต่างกัน แบบจำลองแมชชีนเลิร์นนิงสามารถฝึกหาปริมาณความเสี่ยงทางคลินิกของบุคคลในการเกิดโรคร้ายแรงได้ หากพวกเขาติดเชื้อร้ายแรง เช่น โควิด-19: แนวโน้มที่พวกเขาจะต้องได้รับการดูแลเป็นพิเศษคืออะไร จำกัด? มีโอกาสแค่ไหนที่พวกเขาจะยอมจำนนต่อความเจ็บป่วย? ข้อมูลดังกล่าวสามารถรวมประวัติทางการแพทย์พื้นฐานของผู้คนได้

ผลลัพธ์มีความแม่นยำอย่างสมเหตุสมผล ตัวอย่างเช่น รายงานสาธารณะล่าสุดของ Metabiota เมื่อวันที่ 25 กุมภาพันธ์ คาดการณ์ว่าในวันที่ 3 มีนาคม จะมีผู้ ป่วย COVID-19 รวม 1,27,000 รายทั่วโลก จำนวนนี้เกินมาประมาณ 30,000 คน แต่ Mark Gallivan ผู้อำนวยการฝ่าย Data Science ของบริษัทในขณะนั้น กล่าวว่าตัวเลขนี้ยังอยู่ในห้องของข้อผิดพลาด นอกจากนี้ ยังบันทึกประเทศที่มีแนวโน้มว่าจะรายงานผู้ป่วยรายใหม่มากที่สุด ซึ่งรวมถึงจีน อิตาลี อิหร่าน และสหรัฐอเมริกา

ระบบ DeepMind AI ของ Google ถูกใช้เพื่อแยกแยะคุณลักษณะของไวรัส ซึ่งอาจช่วยให้เข้าใจว่าไวรัสทำงานอย่างไร ข้อมูลนี้จะพิสูจน์ได้ว่ามีประโยชน์ในการพิจารณาว่าควรหายาชนิดใด คนอื่น ๆ ได้รวมเทคโนโลยีที่พัฒนาโดย BenevolentAI ซึ่งเป็นสตาร์ทอัพด้านชีวสารสนเทศในอังกฤษซึ่งใช้ปัญญาประดิษฐ์เพื่อค้นหาวิธีการรักษาที่มีอยู่สำหรับโรคต่างๆ ซึ่งอาจมีประสิทธิภาพในการรักษา COVID-19

การใช้เทคโนโลยีการจดจำใบหน้าและซอฟต์แวร์ตรวจจับอุณหภูมิของ SenseTime ของจีนเพื่อตรวจหาบุคคลที่อาจมีไข้และอาจต้องติดเชื้อก็ช่วยได้เช่นกัน นวัตกรรมที่คล้ายคลึงกันนี้ให้พลังแก่ 'หมวกกันน็อคอัจฉริยะ' ที่ทางการใช้ในดินแดนเสฉวนเพื่อตรวจหาบุคคลที่มีอาการไข้

รัฐบาลจีนได้สร้างระบบเฝ้าระวังเพิ่มเติมที่เรียกว่า Health Code ซึ่งใช้ข้อมูลขนาดใหญ่เพื่อระบุและประเมินความเสี่ยงของแต่ละคนขึ้นอยู่กับประวัติการเดินทางของพวกเขา ระยะเวลาที่พวกเขาใช้ในจุดที่มีการติดเชื้อ และโอกาสในการสัมผัสกับไวรัส . ผู้อยู่อาศัยจะได้รับรหัสสี (แดง เหลือง หรือเขียว) ซึ่งพวกเขาสามารถได้รับผ่านแอปพลิเคชันหลักอย่าง WeChat หรือ AliPay เพื่อแสดงว่าควรแยกหรืออนุญาตให้ออกสู่สาธารณะ

แตกต่างจากการทดสอบทางการแพทย์ที่หายาก มีราคาแพง และมักจะได้รับการส่งมอบโดยมีความล่าช้า วิธีการทำให้เป็นส่วนตัวแบบดิจิทัลที่ขับเคลื่อนด้วยข้อมูลทางคลินิกนี้สามารถนำไปใช้ได้อย่างรวดเร็วและปรับขนาดได้ค่อนข้างง่าย จะช่วยให้มีการจัดสรรทรัพย์สินที่ดีขึ้นและน่าสนใจยิ่งขึ้นในกรณีที่อุปกรณ์ทางการแพทย์หายาก เช่น หน่วยทดสอบ หน้ากากป้องกัน และเตียงในโรงพยาบาล

มันสามารถให้อำนาจเราด้วยโมเดลที่ถูกต้องและเปิดใช้งานการกักกันที่ปลอดภัยยิ่งขึ้นในอัตราที่เร็วกว่าที่อนุญาตโดยแนวทางปฏิบัติที่ดีที่สุดสำหรับ COVID-19 ที่แยกจากแทร็กทดสอบในปัจจุบัน ซึ่งทุกคนที่ติดเชื้อและผู้ติดต่อของพวกเขาจะถูกคุมขัง โดยไม่คำนึงถึง ว่าโดยทั่วไปปลอดภัยหรือแสดงอาการของโรคร้ายแรง

การขุดเพื่อข้อมูล

ข้อมูลการเคลื่อนไหวของมนุษย์และข้อมูลโทรคมนาคมที่ใช้ระหว่างการระบาดของโรคอีโบลาในแอฟริกาตะวันตก และได้รับการตรวจสอบเพิ่มเติมโดย UNICEF Innovation Lab, Flowminder และองค์กรอื่นๆ วัตถุประสงค์หลักพื้นฐานคือการทำความเข้าใจแนวโน้มการเคลื่อนไหวของมนุษย์เกี่ยวกับมาตรการล็อกดาวน์ และประเมินอันตรายของการเกิดโรคในภูมิภาคเฉพาะ

โดยการใช้โปรแกรม EPI Info Viral Hemorrhagic Fever this Disease can be Control ซึ่งเป็นโปรแกรมโอเพนซอร์สที่ระบุผู้ที่ติดเชื้อไวรัส และสร้างฐานข้อมูลขนาดใหญ่ของข้อมูลผู้ป่วยที่รวมชื่อ เพศ อายุ สถานที่ ทางการแพทย์ ประวัติและตัวระบุอื่น ๆ อีกมากมาย

ในการประยุกต์ใช้การวิเคราะห์ข้อมูลขนาดใหญ่ บริษัทสัญชาติสวีเดนชื่อ Flowminder ใช้บันทึกทางโทรศัพท์ในปี 2013 ในเซเนกัลเพื่อซ้อนทับการระบาดในอดีตของการติดเชื้อในรูปแบบการจราจรเพื่อคาดการณ์การเคลื่อนไหวและการเติบโตของอีโบลาภายในประเทศ แม้ว่าส่วนสำคัญของการตอบสนองต่ออีโบลาจะถูกสร้างขึ้นในโครงสร้างพื้นฐานทางกายภาพและการปฏิบัติการ เป็นที่ชัดเจนว่าการตอบสนองนั้นเสริมด้วยความสามารถในการใช้ประโยชน์จากข้อมูล

แนวทางที่สองคือการทำเหมืองข้อมูลของโซเชียลมีเดียและกิจกรรมเสิร์ชเอ็นจิ้น ซึ่งสามารถแสดงได้อย่างรวดเร็วว่าการระบาดเกิดขึ้นที่ใด อย่างไรก็ตาม ข้อมูลจากการใช้ร่วมกันทางสังคมและคำค้นหาของเครื่องมือค้นหาอาจทำให้เข้าใจผิดและไม่ควรเชื่อถือเพียงอย่างเดียว ในทางกลับกัน องค์กรด้านการดูแลสุขภาพกำลังรวบรวมข้อมูลจากแหล่งเหล่านี้กับชุดข้อมูลทางการแพทย์แบบดั้งเดิม และใช้ความสามารถทางการแพทย์เมื่อวิเคราะห์แนวโน้ม Daniel Bausch ผู้อำนวยการทีมสนับสนุนเร่งด่วนด้านสาธารณสุขของสหราชอาณาจักร มองเห็นศักยภาพอันน่าทึ่งในชุดข้อมูลที่รวบรวมจากโซเชียลมีเดีย

เมื่อเร็ว ๆ นี้ Big Data Laboratory ที่สำนักงานโครงการกลยุทธ์การพัฒนา Nizhny Novgorod ได้พัฒนาแบบจำลองทางคณิตศาสตร์เพื่อทำนายการแพร่กระจายของ COVID-19 โมเดลนี้ใช้ข้อมูลเกี่ยวกับประเทศและเขตส่วนใหญ่ที่ได้เผยแพร่ข้อมูลเชิงลึกเกี่ยวกับโควิด-19 รวมถึง 297 ภูมิภาคทั่วโลกและ 21 ดินแดนในอิตาลี

ทีมงานได้เฝ้าสังเกตการวิจัยของรัสเซียและทั่วโลกเกี่ยวกับ COVID-19 อย่างต่อเนื่อง นี่หมายความว่าพวกเขาสามารถรวบรวมข้อมูลสำหรับแบบจำลองได้จากทุกที่ในโลก ทั้งที่รวบรวมโดยประเทศ และกระจายตามภูมิภาคและดินแดนที่เล็กกว่า การวิเคราะห์ได้รวมเมืองในเมืองหลายสิบแห่งเข้าด้วยกัน เพื่อแยกแยะเมืองที่มีพารามิเตอร์ทางระบาดวิทยาที่ใกล้เคียงที่สุด (นโยบาย ขนาดประชากร และความหนาแน่น) แบบจำลองที่พัฒนาขึ้นดังกล่าวช่วยในการพยากรณ์การระบาดใหญ่ด้วย ความแม่นยำ 2.5%

แนวทางหนึ่งที่จะนำมาใช้คือการจัดตั้งคณะกรรมการจริยธรรมอิสระหรือการเชื่อถือข้อมูล งานของพวกเขาคือการสร้างกลไกการกำกับดูแลข้อมูลเพื่อค้นหาความสามัคคีระหว่างผลประโยชน์สาธารณะที่ขัดแย้งกันในขณะเดียวกันก็รับประกันความปลอดภัยส่วนบุคคล

อ่านเพิ่มเติม: สิ่งที่ต้องทำในช่วงล็อกดาวน์

รับ ใบรับรองวิทยาศาสตร์ข้อมูล จากมหาวิทยาลัยชั้นนำของโลก เรียนรู้หลักสูตร Executive PG Programs, Advanced Certificate Programs หรือ Masters Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

บทสรุป

เมื่อเราพัฒนาความก้าวหน้าใหม่ๆ ที่คาดว่าจะรวบรวม เผยแพร่ และใช้ข้อมูลเพื่อช่วยในการต่อสู้กับโรคระบาด เรายังต้องแน่ใจว่าพวกเขาเคารพหลักปฏิบัติที่ดีที่สุดทางจริยธรรม แท้จริงแล้ว แม้ในสถานการณ์ฉุกเฉิน เราจำเป็นต้องปฏิบัติตามแนวทางการรักษาความปลอดภัยของข้อมูลและรับประกันว่าข้อมูลจะถูกนำไปใช้ประโยชน์อย่างมีจริยธรรม

การให้ผู้บุกเบิกในภาครัฐ ภาคธุรกิจ และบริการทางการแพทย์ไว้วางใจเครื่องมือเหล่านี้จะเปลี่ยนความรวดเร็วในการตอบสนองต่อการระบาดของโรคโดยพื้นฐานแล้ว

หากคุณอยากเรียนรู้เกี่ยวกับวิทยาศาสตร์ข้อมูล ให้ลองดูประกาศนียบัตร PG ด้านวิทยาศาสตร์ข้อมูลของ IIIT-B และ upGrad ซึ่งสร้างขึ้นสำหรับมืออาชีพด้านการทำงานและเสนอกรณีศึกษาและโครงการมากกว่า 10 รายการ เวิร์กช็อปภาคปฏิบัติจริง การให้คำปรึกษากับผู้เชี่ยวชาญในอุตสาหกรรม 1- on-1 กับที่ปรึกษาในอุตสาหกรรม การเรียนรู้มากกว่า 400 ชั่วโมงและความช่วยเหลือด้านงานกับบริษัทชั้นนำ

เสิร์ชเอ็นจิ้นจะช่วยป้องกันการแพร่ระบาดได้อย่างไร?

ผู้มีอำนาจตัดสินใจสามารถรวบรวมความต้องการของผู้ใช้และฮอตสปอตแบบเรียลไทม์โดยใช้ข้อมูลขนาดใหญ่จากเสิร์ชเอ็นจิ้นเพื่อช่วยในการเลือกการป้องกันการระบาดใหญ่ ข้อมูลที่ได้จากการค้นหาอาจนำไปใช้เพื่อช่วยหลีกเลี่ยงและควบคุมการระบาดใหญ่โดยทำความเข้าใจความต้องการของผู้บริโภคในระหว่างการระบาด การจัดสรรวัสดุ นวัตกรรมผลิตภัณฑ์หลังการระบาดใหญ่ และการพัฒนาอุตสาหกรรม ข้อมูลการนำทางและเครื่องมือค้นหา เช่น ข้อมูลโซเชียลมีเดีย เป็นแหล่งสำคัญของการป้องกันโรคและควบคุมข้อมูลขนาดใหญ่ พวกเขาไม่มีส่วนเกี่ยวข้องกับการรักษาพยาบาลหรือการวินิจฉัยโรค แต่ข้อมูลที่คาดหวังของพวกเขาสามารถแสดงถึงความก้าวหน้าของโรคและดึงความสนใจของผู้คนไปยังเงื่อนไขบางอย่าง

เทคโนโลยีการวิเคราะห์ด้วยภาพจะช่วยป้องกันการแพร่ระบาดได้อย่างไร

เป็นไปได้ที่จะรับรู้ถึงความสัมพันธ์ระหว่างชุดข้อมูลขนาดใหญ่โดยใช้เทคโนโลยีการวิเคราะห์ด้วยภาพ ช่วยให้ผู้ตรวจสอบได้รับการรับรู้ด้วยภาพอย่างเป็นธรรมชาติมากขึ้นและช่วยในการตัดสินใจที่มีประสิทธิภาพ ปัจจุบัน รัฐบาลและผู้กำหนดนโยบายหลักสามารถใช้แหล่งข้อมูลขนาดใหญ่ดังกล่าวเพื่อทำการวิเคราะห์ด้วยภาพของการเฝ้าติดตามสถานการณ์การระบาดใหญ่ ทรัพยากรทางการแพทย์ สถานประกอบการของโรงพยาบาล และการตรวจคัดกรองผู้สัมผัสใกล้ชิดเพื่อทำการเลือก รัฐบาลทุกแห่งใช้การวิเคราะห์ด้วยภาพของบิ๊กดาต้าเพื่อแสดงภาพตัวบ่งชี้ที่สำคัญของโควิด เช่น ข้อมูลเคส การแพร่กระจายของไวรัส แนวโน้มสถานการณ์การระบาดใหญ่ และรายงานฮอตสปอตในแบบเรียลไทม์ เทคโนโลยีสามารถเติมเต็มสิทธิของประชาชนในการรู้เท่าที่เป็นไปได้ และช่วยให้ผู้กำหนดนโยบายมีความเข้าใจอย่างครอบคลุมเกี่ยวกับสถานการณ์การระบาดใหญ่และช่วยในการตัดสินใจทางวิทยาศาสตร์

NLP มีบทบาทอย่างไรในการป้องกันการแพร่ระบาด?

รัฐบาลอาจปรับปรุงความแม่นยำในการรู้จำคำพูดโดยใช้การเรียนรู้เชิงลึกสำหรับการประมวลผลภาษาธรรมชาติ (NLP) การรับรู้ดังกล่าวรวมถึงการรู้จำเอนทิตี การจัดหมวดหมู่ข้อความอัตโนมัติของเนื้อหาที่ละเอียดอ่อน เอกสาร รายงาน ข่าวสาร และอื่นๆ สำหรับการตรวจสอบทัศนคติของสาธารณชนบนอินเทอร์เน็ต ระบบเตือนภัยล่วงหน้า กลไกการสื่อสารข้อมูล การขุดข่าวลือ กระแสการวิเคราะห์ความคิดเห็นของสาธารณชน และการบรรเทาทุกข์ในที่สาธารณะ ข้อมูลนี้อาจได้รับผ่านทางอินเทอร์เน็ตและแพลตฟอร์มเครือข่ายสังคมออนไลน์ เทคโนโลยีการประมวลผลภาษาธรรมชาติ (NLP) สามารถช่วยในการเตือนล่วงหน้า การแพร่กระจายข่าวลือ การติดตามการเปลี่ยนแปลงของโรค จุดร้อนทางสังคม และการผลักดันข้อมูลในการป้องกันและควบคุมการระบาดใหญ่