บิ๊กดาต้าและแมชชีนเลิร์นนิงร่วมกันต่อต้านมะเร็งได้อย่างไร
เผยแพร่แล้ว: 2018-01-09มะเร็งไม่ใช่โรคเดียว เป็นโรคมากมาย ให้เราเข้าใจสาเหตุของโรคมะเร็งด้วยตัวอย่างง่ายๆ หากคุณถ่ายสำเนาเอกสารเนื่องจากปัญหาบางอย่าง จุดหรือรอยเปื้อนอื่นๆ ปรากฏบนเอกสารนั้นแม้ว่าจะไม่มีอยู่ในต้นฉบับก็ตาม ในทำนองเดียวกัน ในกระบวนการจำลองแบบยีน ข้อผิดพลาดเกิดขึ้นโดยไม่ได้ตั้งใจ โดยส่วนใหญ่แล้วยีนที่มีข้อผิดพลาดจะไม่สามารถรักษาไว้ได้และจะพินาศในท้ายที่สุด
ในบางกรณีที่พบได้ยาก ยีนกลายพันธุ์ที่มีข้อผิดพลาดจะอยู่รอดและถูกจำลองแบบต่อไปอย่างควบคุมไม่ได้ การจำลองแบบที่ไม่สามารถควบคุมได้ของยีนกลายพันธุ์เป็นสาเหตุหลักของมะเร็ง การกลายพันธุ์นี้สามารถเกิดขึ้นได้กับยีนสองหมื่นตัวในร่างกายของเรา การแปรผันของยีนอย่างใดอย่างหนึ่งหรือหลายอย่างรวมกันทำให้มะเร็งเป็นโรคร้ายแรงที่ต้องเอาชนะ เพื่อกำจัดมะเร็ง เราจำเป็นต้องมีวิธีการที่จะทำลายเซลล์อันธพาลโดยไม่ทำอันตรายต่อเซลล์ที่ทำหน้าที่ของร่างกาย ซึ่งทำให้เอาชนะได้ยากเป็นทวีคูณ
สารบัญ
มะเร็งกับความซับซ้อน
มะเร็งเป็นโรคที่มีการกระจายหางยาว การกระจายแบบหางยาวหมายความว่ามีเหตุผลหลายประการสำหรับเงื่อนไขนี้ที่จะเกิดขึ้น และไม่มีวิธีแก้ปัญหาเดียวสำหรับการกำจัดมัน มีโรคที่ส่งผลกระทบต่อประชากรจำนวนมาก แต่มีสาเหตุเดียวเท่านั้น ตัวอย่างเช่น ให้เราพิจารณาอหิวาตกโรค การรับประทานอาหารหรือน้ำดื่มที่ปนเปื้อนเชื้อแบคทีเรีย Vibrio Cholerae จึงเป็นสาเหตุของอหิวาตกโรค อหิวาตกโรคสามารถเกิดขึ้นได้เพียงเพราะ Vibrio Cholerae และไม่มีเหตุผลอื่น เมื่อเราค้นพบสาเหตุเดียวของโรคแล้ว ก็สามารถเอาชนะได้ง่ายทีเดียว

เกิดอะไรขึ้นถ้าเงื่อนไขเกิดขึ้นเนื่องจากหลายสาเหตุ? การกลายพันธุ์อาจเกิดขึ้นได้ในยีนสองหมื่นตัวในร่างกายของเรา ไม่เพียงแค่นั้น แต่เรายังต้องพิจารณาถึงการผสมผสานของพวกเขาด้วย มะเร็งไม่ได้เกิดขึ้นเพียงเนื่องจากการกลายพันธุ์แบบสุ่มในยีน แต่ยังเกิดจากการกลายพันธุ์ของยีนรวมกันด้วย สาเหตุของมะเร็งมีจำนวนเพิ่มขึ้นอย่างมาก และไม่มีกลไกใดที่จะรักษาให้หายขาดได้ ตัวอย่างเช่น การกลายพันธุ์ของยีนเหล่านี้ ALK, BRAF, DDR2, EGFR, ERBB2, KRAS, MAP2K1, NRAS, PIK3CA, PTEN, RET และ RIT1 สามารถทำให้เกิดมะเร็งปอดได้ มะเร็งเกิดได้หลายวิธี ด้วยเหตุนี้จึงเป็นโรคที่มีการกระจายหางยาว
ในคลังแสงของเราในการทำสงครามกับมะเร็งและพิชิตมัน ข้อมูลขนาดใหญ่และการเรียนรู้ของเครื่องเป็นเครื่องมือที่สำคัญ ข้อมูลขนาดใหญ่จะช่วยต่อสู้กับสงครามครั้งนี้ได้อย่างไร? แมชชีนเลิร์นนิงเกี่ยวอะไรกับมะเร็ง? จะช่วยต่อสู้กับโรคจากหลายสาเหตุ อาการหางยาวได้อย่างไร ? ประการแรก ข้อมูลขนาดใหญ่นี้สร้างขึ้นอย่างไรและที่ไหน ให้เราหาคำตอบสำหรับคำถามเหล่านี้
ลำดับยีนและการระเบิดในข้อมูล
การจัดลำดับยีนเป็นพื้นที่หนึ่งที่สร้างข้อมูลจำนวนมหาศาล ข้อมูลเท่าไหร่กันแน่? ตามที่ Washington Post ระบุ ข้อมูลของมนุษย์ที่สร้างขึ้นผ่านการจัดลำดับยีน (ประมาณ 2.5 แสนลำดับ) ใช้เวลาประมาณหนึ่งในสี่ของขนาดการผลิตข้อมูลประจำปีของ YouTube หากข้อมูลทั้งหมดนี้ถูกรวมเข้ากับข้อมูลพิเศษทั้งหมดที่มาพร้อมกับการจัดลำดับจีโนมและบันทึกไว้ในดีวีดีขนาด 4GB ข้อมูลนั้นจะสูงราวครึ่งไมล์

วิธีการสำหรับการจัดลำดับยีนได้รับการปรับปรุงในช่วงหลายปีที่ผ่านมา และค่าใช้จ่ายสำหรับวิธีเดียวกันก็ลดลงแบบทวีคูณ ในปี 2551 ค่าใช้จ่ายในการจัดลำดับยีนอยู่ที่ 10 ล้านดอลลาร์ ณ วันนี้ เหลือเพียง 1,000 เหรียญ ในอนาคตคาดว่าจะลดลงอีก คาดว่าผู้คนหนึ่งพันล้านคนจะมีลำดับยีนของพวกเขาในปี 2025 ดังนั้นภายในทศวรรษหน้า ข้อมูลจีโนมที่สร้างขึ้นจะอยู่ที่ประมาณ 2-40 เอ็กซาไบต์ในหนึ่งปี เอ็กซาไบต์คือสิบตามด้วยศูนย์ 17 ตัว
ก่อนจะมาว่าข้อมูลจะช่วยในการรักษามะเร็งได้อย่างไร เรามาดูตัวอย่างที่เป็นรูปธรรมและดูว่าข้อมูลจะช่วยเอาชนะโรคได้อย่างไร ข้อมูลและการวิเคราะห์ช่วยในการค้นหาสาเหตุของโรคติดเชื้อหนึ่งโรคและต่อสู้กับมัน ไม่ใช่ตอนนี้แต่ในศตวรรษที่สิบเก้าด้วยตัวมันเอง! ใช่ในศตวรรษที่สิบเก้า! ชื่อของโรคนั้นคืออหิวาตกโรค
การรวมกลุ่มในศตวรรษที่สิบเก้า – การพัฒนาอหิวาตกโรค
จอห์น สโนว์เป็นวิสัญญีแพทย์และอหิวาตกโรคได้แพร่ระบาดในเดือนกันยายน พ.ศ. 2397 ใกล้กับบ้านของสโนว์ เพื่อทราบสาเหตุของอหิวาตกโรค สโนว์จึงตัดสินใจสังเกตมิติเชิงพื้นที่ของผู้ป่วยบนแผนที่เมือง เขาทำเครื่องหมายที่ตั้งของที่อยู่บ้านของผู้ป่วยบนแผนที่เมืองลอนดอน ด้วยการออกกำลังกายนี้ จอห์น สโนว์เข้าใจว่าคนที่ทุกข์ทรมานจากอหิวาตกโรคถูกรวมกลุ่มกันรอบบ่อน้ำบางแห่ง เขาเชื่อมั่นอย่างแรงกล้าว่าปั๊มที่ปนเปื้อนเป็นต้นเหตุของการแพร่ระบาดและขัดต่อเจตจำนงของหน่วยงานท้องถิ่นที่เปลี่ยนปั๊มดังกล่าว การทดแทนนี้ช่วยลดการแพร่กระจายของอหิวาตกโรคได้อย่างมาก
ต่อมาสโนว์ได้ตีพิมพ์แผนที่การระบาดเพื่อสนับสนุนทฤษฎีของเขา โดยแสดงตำแหน่งของบ่อน้ำสาธารณะ 13 แห่งในพื้นที่ และผู้เสียชีวิตจากอหิวาตกโรค 578 ราย โดยระบุแผนที่โดยที่อยู่บ้าน แผนที่นี้นำไปสู่ความเข้าใจว่าอหิวาตกโรคเป็นโรคติดเชื้อและแพร่กระจายอย่างรวดเร็วผ่านตัวกลางของน้ำ การทดลองของ John Snow เป็นตัวอย่างแรกสุดของการใช้อัลกอริธึมการจัดกลุ่มเพื่อทราบสาเหตุของการเจ็บป่วยและช่วยกำจัดมัน ในศตวรรษที่สิบเก้า John Snow สามารถใช้อัลกอริทึมการจัดกลุ่มบนแผนที่เมืองลอนดอนด้วยดินสอ ด้วยโรคมะเร็งที่เป็นโรคเป้าหมาย การวิเคราะห์ระดับนี้จึงไม่สามารถทำได้ง่ายเหมือนการวิเคราะห์ของ John Snow เราต้องการเครื่องมือและเทคโนโลยีที่ซับซ้อนเพื่อขุดข้อมูลนี้ นั่นคือที่ที่เราใช้ประโยชน์จากความสามารถของเทคโนโลยีสมัยใหม่ เช่น Machine Learning และ Big Data
ข้อมูลขนาดใหญ่และการเรียนรู้ของเครื่อง – เครื่องมือในการต่อสู้กับโรคมะเร็ง
ข้อมูลจำนวนมหาศาลพร้อมกับอัลกอริธึมการเรียนรู้ของเครื่องจะช่วยเราในการต่อสู้กับโรคมะเร็งได้หลายวิธี สามารถช่วยเราในการวินิจฉัย การรักษา และการพยากรณ์โรค โดยหลักแล้วมันจะช่วยปรับแต่งการบำบัดตามผู้ป่วยเป็นหลักซึ่งไม่สามารถทำได้อย่างอื่น ยังจะช่วยจัดการกับหางยาวของการกระจาย

ด้วยจำนวนมหาศาลของเวชระเบียนอิเล็กทรอนิกส์ (EMR) ข้อมูลที่สร้างและบันทึกโดยโรงพยาบาลต่างๆ สามารถใช้ข้อมูลที่ 'ติดป้ายกำกับ' ในการวินิจฉัยมะเร็งได้ เทคนิคต่างๆ เช่น โปรแกรมภาษาธรรมชาติ (NLP) ใช้เพื่อทำความเข้าใจใบสั่งยาของแพทย์ และมีการใช้ Deep Learning Neural Networks เพื่อวิเคราะห์การสแกน CT และ MRI อัลกอริธึมการเรียนรู้ของเครื่องประเภทต่างๆ ค้นหาฐานข้อมูล EMR และค้นหารูปแบบที่ซ่อนอยู่ รูปแบบที่ซ่อนอยู่เหล่านี้จะช่วยในการวินิจฉัยโรคมะเร็ง
นักศึกษาวิทยาลัยสามารถออกแบบโครงข่ายประสาทเทียมจากความสะดวกสบายในบ้านของเธอ และพัฒนาแบบจำลองที่สามารถวินิจฉัยมะเร็งเต้านมได้อย่างแม่นยำในระดับสูง
การวินิจฉัยด้วย Big Data และ Machine Learning
Brittanny Wenger อายุ 16 ปีเมื่อลูกพี่ลูกน้องของเธอได้รับการวินิจฉัยว่าเป็นมะเร็งเต้านม สิ่งนี้เป็นแรงบันดาลใจให้เธอทำให้กระบวนการนี้ดีขึ้นโดยการปรับปรุงการวินิจฉัย ความทะเยอทะยานด้วยเข็มละเอียด (FNA) เป็นวิธีการตรวจชิ้นเนื้อที่ไม่รุกรานและเป็นวิธีการวินิจฉัยที่รวดเร็วที่สุด แพทย์ลังเลที่จะใช้ FNA เพราะผลลัพธ์ไม่น่าเชื่อถือ Brittanny คิดว่าจะใช้ทักษะการเขียนโปรแกรมของเธอทำอะไรกับมัน เธอตัดสินใจปรับปรุงความน่าเชื่อถือของ FNA ซึ่งจะทำให้ผู้หญิงสามารถเลือกวิธีการวินิจฉัยที่ไม่รุกรานและสะดวกสบายน้อยลง
Brittanny พบข้อมูลสาธารณสมบัติจากมหาวิทยาลัยวิสคอนซินซึ่งรวมถึงความทะเยอทะยานของ Fine Needle เธอเขียนโค้ดเครือข่ายประสาทเทียม (ANN) ซึ่งได้รับแรงบันดาลใจจากการออกแบบสถาปัตยกรรมสมองของมนุษย์ เธอใช้เทคโนโลยีคลาวด์เพื่อประมวลผลข้อมูลและฝึก ANN เพื่อค้นหาความคล้ายคลึงกัน หลังจากพยายามและข้อผิดพลาดหลายครั้งในท้ายที่สุด เครือข่ายของเธอสามารถตรวจพบมะเร็งเต้านมจากข้อมูลการทดสอบ FNA ที่มีความไวต่อความร้ายกาจ 99.1% วิธีนี้ใช้ได้กับการวินิจฉัยมะเร็งชนิดอื่นๆ ด้วย

ความถูกต้องของการวินิจฉัยขึ้นอยู่กับปริมาณและคุณภาพของข้อมูลที่มี ยิ่งมีข้อมูลมากเท่าใด อัลกอริทึมก็จะยิ่งสามารถสืบค้นฐานข้อมูล ค้นหาความคล้ายคลึงกัน และนำเสนอโมเดลที่มีค่า
การรักษาด้วย Big Data และ Machine Learning
ข้อมูลขนาดใหญ่และแมชชีนเลิร์นนิงจะมีประโยชน์ไม่เพียงแต่สำหรับการวินิจฉัยแต่การรักษาด้วย จอห์นและเคธีแต่งงานกันมาสามทศวรรษแล้ว เมื่ออายุ 49 ปี Kathy ได้รับการวินิจฉัยว่าเป็นมะเร็งเต้านมระยะที่ 3 John, CIO ของโรงพยาบาลในบอสตันช่วยวางแผนการรักษาของเธอด้วยความช่วยเหลือของเครื่องมือข้อมูลขนาดใหญ่ที่เขาออกแบบและนำมาใช้
ในปี 2551 โรงพยาบาลในเครือฮาร์วาร์ด 5 แห่งได้แชร์ฐานข้อมูลและสร้างเครื่องมือค้นหาที่มีประสิทธิภาพซึ่งรู้จักกันในชื่อ 'เครือข่ายข้อมูลการวิจัยด้านสุขภาพที่ใช้ร่วมกัน' (SHRINE) ในช่วงเวลาของการวินิจฉัยของ Kathy แพทย์ของเธอสามารถลอดผ่านฐานข้อมูล 6.1 ล้านระเบียนเพื่อค้นหาข้อมูลที่ลึกซึ้ง แพทย์ถาม 'SHRINE' ด้วยคำถามเช่น "ผู้หญิงเอเชียอายุ 50 ปี ที่ได้รับการวินิจฉัยว่าเป็นมะเร็งเต้านมระยะที่ 3 และการรักษาของพวกเธอ" ด้วยข้อมูลนี้ แพทย์สามารถรักษาเธอด้วยยาเคมีบำบัดโดยกำหนดเป้าหมายไปยังเซลล์เนื้องอกที่ไวต่อฮอร์โมนเอสโตรเจนโดยหลีกเลี่ยงการผ่าตัด
เมื่อ Kathy เสร็จสิ้นการรักษาด้วยเคมีบำบัด นักรังสีวิทยาก็ไม่พบเซลล์เนื้องอกอีกต่อไป นี่เป็นตัวอย่างหนึ่งของวิธีการที่เครื่องมือบิ๊กดาต้าสามารถช่วยในการปรับแต่งแผนการรักษาตามความต้องการของแต่ละคน
เนื่องจากมะเร็งคือการแพร่กระจายแบบหางยาว ปรัชญา 'หนึ่งขนาดที่เหมาะกับทุกคน' จึงใช้ไม่ได้ผล สำหรับการปรับแต่งการรักษาตามประวัติของผู้ป่วย ลำดับยีน ผลลัพธ์ของการตรวจวินิจฉัย การกลายพันธุ์ที่พบในยีนของผู้ป่วย หรือการรวมกันของยีนและสภาพแวดล้อม ข้อมูลขนาดใหญ่ และเครื่องมือการเรียนรู้ของเครื่องเป็นสิ่งที่ขาดไม่ได้
การค้นพบยาด้วย Big Data และ Machine Learning
ข้อมูลขนาดใหญ่และแมชชีนเลิร์นนิงจะไม่เพียงช่วยในการวินิจฉัยและรักษา แต่ยังปฏิวัติการค้นพบยาอีกด้วย นักวิจัยสามารถใช้ข้อมูลเปิดและทรัพยากรในการคำนวณเพื่อค้นหาการใช้ใหม่ ๆ สำหรับยาที่ได้รับการอนุมัติจากหน่วยงานเช่น FDA เพื่อวัตถุประสงค์อื่น ตัวอย่างเช่น นักวิทยาศาสตร์จากมหาวิทยาลัยแคลิฟอร์เนียแห่งซานฟรานซิสโกพบว่ามีการใช้ยาที่เรียกว่า 'pyrvinium pamoate' ซึ่งใช้รักษาพยาธิเข็มหมุด สามารถลดขนาดของมะเร็งตับ ซึ่งเป็นมะเร็งตับชนิดหนึ่งในหนูทดลองได้ โรคนี้ซึ่งเกี่ยวข้องกับตับเป็นสาเหตุอันดับสองของการเสียชีวิตด้วยโรคมะเร็งในโลก

ข้อมูลขนาดใหญ่ไม่เพียงแต่ใช้ในการค้นพบการใช้ใหม่ ๆ สำหรับยาเก่า แต่ยังสามารถใช้เพื่อตรวจหายาใหม่ได้อีกด้วย โดยรวบรวมข้อมูลที่เกี่ยวข้องกับยา สารเคมี และคุณสมบัติ อาการของโรคต่างๆ องค์ประกอบทางเคมีของยาที่ใช้สำหรับอาการเหล่านั้นและผลข้างเคียงของยาเหล่านี้ที่รวบรวมจากสื่อต่างๆ ยาใหม่สามารถคิดค้นสำหรับมะเร็งประเภทต่างๆ การดำเนินการนี้จะช่วยลดเวลาในการผลิตยาใหม่ได้อย่างมากโดยไม่ต้องเสียเงินหลายล้านดอลลาร์ในกระบวนการนี้
การใช้ข้อมูลขนาดใหญ่และการเรียนรู้ของเครื่องจะช่วยปรับปรุงกระบวนการวินิจฉัย การรักษา และการค้นพบยาในการรักษามะเร็งได้อย่างไม่ต้องสงสัย แต่ก็ใช่ว่าจะไม่มีความท้าทาย ข้างหน้ามีอุปสรรคและปัญหามากมาย หากบล็อกเหล่านี้ไม่ถูกลบออก และไม่เผชิญกับความท้าทายเหล่านี้ ศัตรูของเราจะได้เปรียบและเอาชนะเราในการต่อสู้ครั้งต่อไป
ความท้าทายในการใช้ Big Data และ Machine Learning เพื่อต่อสู้กับโรคมะเร็ง
การแปลงเป็นดิจิทัล
ยกเว้นโรงพยาบาลขนาดใหญ่และทันสมัยบางแห่ง ส่วนใหญ่ยังไม่ได้แปลงเป็นดิจิทัล พวกเขายังคงปฏิบัติตามวิธีการแบบเก่าในการรวบรวมและบันทึกข้อมูลในไฟล์จำนวนมาก เนื่องจากขาดความเชี่ยวชาญทางเทคนิค ความสามารถในการจ่ายได้ การประหยัดต่อขนาด และสาเหตุอื่นๆ การแปลงเป็นดิจิทัลจึงไม่เกิดขึ้น การจัดหาซอฟต์แวร์โอเพ่นซอร์ส EMR สอนว่าบันทึกดิจิทัลเหล่านี้มีประโยชน์ต่อการรักษาผู้ป่วยอย่างไรและผลกำไรของโรงพยาบาลเป็นขั้นตอนในทิศทางที่ถูกต้อง
ข้อมูลถูกล็อคในคลังสินค้าขององค์กร
ณ วันนี้ มีโรงพยาบาลเพียงไม่กี่แห่งเท่านั้นที่สามารถบันทึกประวัติผู้ป่วยได้ เครื่องมือนี้ถูกล็อกอยู่ในคลังสินค้าขององค์กรเช่นกันและไม่สามารถเข้าถึงโลกได้โดยรวม
โรงพยาบาลไม่เต็มใจที่จะแบ่งปันฐานข้อมูลกับโรงพยาบาลอื่น แม้ว่าพวกเขาจะเต็มใจ แต่ก็ถูกรบกวนโดยสคีมาฐานข้อมูลและสถาปัตยกรรมที่แตกต่างกัน จำเป็นต้องมีการคิดอย่างมีวิจารณญาณในเรื่องนี้เกี่ยวกับวิธีที่โรงพยาบาลสามารถแบ่งปันฐานข้อมูลระหว่างกันเองเพื่อประโยชน์ร่วมกันโดยไม่ต้องสงสัยซึ่งกันและกัน ต้องมีข้อตกลงร่วมกันเกี่ยวกับสคีมาซึ่งควรแชร์ข้อมูลนี้ด้วย เพื่อประโยชน์ของโรงพยาบาลทุกแห่ง ข้อมูลผู้ป่วยนี้ควรเป็นประชาธิปไตยและนำไปใช้เพื่ออนาคตของมนุษยชาติที่ดีขึ้น

ไม่ควรใช้ข้อมูลผู้ป่วยเพื่อการเติบโตขององค์กรเดียว ควรใช้ความระมัดระวังอย่างเต็มที่ในการปกปิดตัวตนของบุคคลที่เป็นเจ้าของข้อมูล หากความชอบลิปสติกของบุคคลรั่วไหลออกมาก็ไม่มีอันตรายอะไรมาก หากประวัติการรักษาของบุคคลรั่วไหลก็จะมีผลกระทบอย่างมากต่อชีวิตและโอกาสของเขา
รัฐบาลควรดำเนินการในเชิงบวกในทิศทางนี้และควรช่วยสร้างโครงสร้างพื้นฐานของข้อมูลขนาดใหญ่สำหรับการจัดเก็บเวชระเบียนของผู้ป่วยจากโรงพยาบาลทั้งหมด ควรกำหนดให้โรงพยาบาลทุกแห่งต้องแชร์ฐานข้อมูลภายในโครงสร้างพื้นฐานที่ใช้ร่วมกันนี้ การเข้าถึงฐานข้อมูลนี้ควรทำฟรีสำหรับการรักษาผู้ป่วยและการวิจัย
การปรับปรุงประสิทธิภาพของอัลกอริธึมการเรียนรู้ของเครื่อง
แมชชีนเลิร์นนิงไม่ใช่ยาวิเศษสำหรับการวินิจฉัยและรักษาโรคมะเร็ง เป็นเครื่องมือที่หากใช้อย่างดีสามารถช่วยเราในการพิชิตมะเร็งได้ แมชชีนเลิร์นนิงยังอยู่ในช่วงเริ่มต้นและมีข้อเสีย ตัวอย่างเช่น ข้อมูลที่อัลกอริทึมเหล่านี้ได้รับการฝึกอบรมจะต้องใกล้เคียงกับข้อมูลที่ใช้ในการสร้างผลลัพธ์ หากมีความแตกต่างกันมาก อัลกอริธึมจะไม่สามารถให้ผลลัพธ์ที่มีความหมายซึ่งสามารถนำมาใช้ได้
มีอัลกอริธึมแมชชีนเลิร์นนิงจำนวนมากซึ่งมีสมมติฐาน ข้อดี และข้อเสียต่างกันไป หากเราสามารถหาวิธีที่จะรวมอัลกอริธึมต่างๆ เหล่านี้เข้าด้วยกันเพื่อให้ได้ผลลัพธ์ที่ต้องการ เช่น การรักษามะเร็ง ไม่จำเป็นต้องพูดว่า เราจะพบผลลัพธ์ที่เป็นประโยชน์อย่างมหาศาล นักวิทยาศาสตร์ด้านแมชชีนเลิร์นนิงชื่อดัง Pedro Domingos เรียกมันว่า "The Master Algorithm" ซึ่งเขียนหนังสือวิทยาศาสตร์ยอดนิยมที่มีชื่อเดียวกัน
ตามที่เปโดรกล่าว มีโรงเรียนแห่งความคิดที่แตกต่างกันห้าแห่งในการเรียนรู้ด้วยเครื่อง นักสัญลักษณ์ นักเชื่อมต่อ Bayesian วิวัฒนาการและการเปรียบเทียบ เป็นเรื่องยากที่จะเข้าสู่ระบบการเรียนรู้ของเครื่องประเภทต่างๆ เหล่านี้ในบทความนี้ ฉันจะกล่าวถึงระบบการเรียนรู้ของเครื่องทั้งห้าประเภทในหนึ่งในบล็อกในอนาคตของฉัน สำหรับตอนนี้ เราต้องเข้าใจว่าวิธีการต่าง ๆ เหล่านี้มีทั้งข้อดีและข้อเสียในตัวเอง หากเราสามารถรวมเข้าด้วยกัน เราก็จะได้ข้อมูลเชิงลึกที่ส่งผลกระทบอย่างสูงจากข้อมูลของเรา สิ่งนี้จะมีประโยชน์อย่างมากไม่เพียงแต่สำหรับการคาดการณ์และการคาดการณ์ทุกประเภท แต่ยังสำหรับการต่อสู้กับศัตรูที่พยาบาทอย่างมะเร็งอีกด้วย

โดยสรุป มะเร็งเป็นศัตรูตัวฉกาจที่คอยเปลี่ยนรูปแบบอยู่เสมอ เรามีอาวุธใหม่ในคลังแสงของเราในขณะนี้ ในรูปแบบของข้อมูลขนาดใหญ่และการเรียนรู้ของเครื่อง อย่างไรก็ตาม เพื่อเผชิญหน้ากับมันอย่างเชี่ยวชาญ แต่การจะรื้อถอนทั้งหมดนั้น เราจำเป็นต้องมีอาวุธที่ทรงพลังมากกว่าที่เรามีอยู่ในปัจจุบัน ชื่อของอาวุธนั้นคือ 'The Master Algorithm'
เรายังจำเป็นต้องทำการเปลี่ยนแปลงบางอย่างในกลยุทธ์และวิธีการที่เรากำลังต่อสู้กับศัตรูตัวนี้ การเปลี่ยนแปลงเหล่านี้กำลังสร้างโครงสร้างพื้นฐานของข้อมูลขนาดใหญ่ ทำให้โรงพยาบาลต้องเปิดเผยบันทึกผู้ป่วยที่ไม่เปิดเผยชื่อ รักษาความปลอดภัยของฐานข้อมูล และอนุญาตให้เข้าถึงฐานข้อมูลฟรีสำหรับการรักษาผู้ป่วยและการวิจัยเพื่อรักษาโรคมะเร็ง
รับ ใบรับรองวิทยาศาสตร์ข้อมูล จากมหาวิทยาลัยชั้นนำของโลก เรียนรู้หลักสูตร Executive PG Programs, Advanced Certificate Programs หรือ Masters Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว
ห่อ
หากคุณสนใจที่จะทราบข้อมูลเพิ่มเติมเกี่ยวกับ Big Data โปรดดูที่ PG Diploma in Software Development Specialization in Big Data program ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีกรณีศึกษาและโครงการมากกว่า 7 กรณี ครอบคลุมภาษาและเครื่องมือในการเขียนโปรแกรม 14 รายการ เวิร์กช็อป ความช่วยเหลือด้านการเรียนรู้และจัดหางานอย่างเข้มงวดมากกว่า 400 ชั่วโมงกับบริษัทชั้นนำ
เรียนรู้ ปริญญาวิศวกรรมซอฟต์แวร์ ออนไลน์จากมหาวิทยาลัยชั้นนำของโลก รับโปรแกรม PG สำหรับผู้บริหาร โปรแกรมประกาศนียบัตรขั้นสูง หรือโปรแกรมปริญญาโท เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

