แมชชีนเลิร์นนิงทำงานอย่างไร – คำแนะนำอย่างง่าย
เผยแพร่แล้ว: 2019-07-31Netflix และ Amazon ทำได้ดีมากในเกมของพวกเขา ดูเหมือนว่าพวกเขาจะรู้อยู่เสมอว่าเนื้อหาหรือผลิตภัณฑ์ใดที่คุณต้องการดู/ซื้อ คุณไม่เพียงแค่ชอบที่จะเห็นทุกอย่างที่จัดไว้ให้ตามรสนิยมและความชอบของคุณหรือไม่?
ในขณะที่พวกเราส่วนใหญ่รู้ความลับเบื้องหลัง Recommendation Engine อันยอดเยี่ยมของ Netflix และ Amazon (Machine Learning แน่นอน!) มีพวกเรากี่คนที่คุ้นเคยกับกลไกภายในของ Machine Learning แล้ว
พูดตรงๆ – Machine Learning ทำงาน อย่างไร ?
โดยพื้นฐานแล้ว Machine Learning เป็นเทคนิคการวิเคราะห์ข้อมูล (ชุดย่อยของ AI) ที่มีจุดมุ่งหมายเพื่อ "เรียนรู้" จากประสบการณ์และทำให้เครื่องทำงานที่ต้องใช้สติปัญญาได้ อัลกอริธึมแมชชีนเลิร์นนิงใช้วิธีคำนวณเพื่อดึงข้อมูลและเรียนรู้โดยตรงจากข้อมูลโดยไม่ต้องตั้งโปรแกรมไว้อย่างชัดเจน (ไม่ต้องพึ่งพาสมการที่กำหนดไว้ล่วงหน้า)
กายวิภาคของระบบการเรียนรู้ของเครื่อง
ระบบ ML ทั้งหมดสามารถแตกตัวเป็นสามส่วน:

- โมเดล – องค์ประกอบที่เกี่ยวข้องกับการระบุตัวตน นั่นคือ การคาดคะเน
- พารามิเตอร์ – หมายถึงปัจจัยที่ใช้โดยแบบจำลองในการตัดสินใจ (การคาดการณ์)
- ผู้เรียน – องค์ประกอบที่ปรับพารามิเตอร์ (และโดยรวมแล้ว แบบจำลอง) โดยพิจารณาความแตกต่างในการคาดคะเนเทียบกับผลลัพธ์จริง
ประเภทของการเรียนรู้ของเครื่อง
เมื่อคุณคุ้นเคยกับองค์ประกอบหลักของระบบ ML แล้ว ก็ถึงเวลาพิจารณาวิธีต่างๆ ที่พวกเขา "เรียนรู้"
การเรียนรู้ภายใต้การดูแล
ใน Supervised Learning โมเดลจะได้รับการฝึกอบรมอย่างชัดเจนเกี่ยวกับวิธีจับคู่อินพุตกับเอาต์พุต อัลกอริธึมการเรียนรู้ภายใต้การดูแลจะนำชุดข้อมูลอินพุตที่รู้จักพร้อมกับการตอบสนอง (เอาต์พุต) ที่ทราบไปยังข้อมูลนั้นและฝึกแบบจำลองเพื่อสร้างการคาดการณ์ที่สมเหตุสมผลเพื่อตอบสนองต่อข้อมูลอินพุตใหม่
การเรียนรู้ภายใต้การดูแลใช้สองวิธีในการพัฒนาแบบจำลองการทำนาย –
- การจัดประเภท – ตามที่ชื่อแนะนำ เทคนิคนี้จัดประเภทข้อมูลที่ป้อนเข้าเป็นหมวดหมู่ต่างๆ โดยการติดป้ายกำกับ ใช้เพื่อคาดการณ์การตอบสนองที่ไม่ต่อเนื่อง (เช่น หากเซลล์มะเร็งไม่เป็นพิษเป็นภัยหรือเป็นมะเร็ง) การถ่ายภาพทางการแพทย์ การรู้จำคำพูด และการให้คะแนนเครดิตเป็นกรณีการใช้งานที่ได้รับความนิยมสามกรณีในการจัดหมวดหมู่
- การถดถอย – เทคนิคนี้ใช้เพื่อทำนายการตอบสนองอย่างต่อเนื่องโดยระบุรูปแบบในข้อมูลที่ป้อนเข้า ตัวอย่างเช่นความผันผวนของอุณหภูมิหรือสภาพอากาศ การถดถอยใช้เพื่อคาดการณ์สภาพอากาศ ปริมาณไฟฟ้า และการซื้อขายอัลกอริธึม
การเรียนรู้แบบไม่มีผู้ดูแล
วิธีการเรียนรู้แบบไม่มีผู้ดูแลจะใช้ข้อมูลที่ไม่มีป้ายกำกับและพยายามคลี่คลายรูปแบบที่ซ่อนอยู่ภายใน ดังนั้น เทคนิคนี้จึงดึงการอนุมานจากชุดข้อมูลซึ่งประกอบด้วยข้อมูลอินพุตที่ไม่มีการตอบกลับที่มีป้ายกำกับ
- การทำ คลัสเตอร์ – หนึ่งในวิธีการเรียนรู้ที่ไม่มีผู้ดูแลที่พบบ่อยที่สุด การจัดกลุ่มเป็นเทคนิคการวิเคราะห์ข้อมูลเชิงสำรวจที่จัดหมวดหมู่ข้อมูลเป็น "คลัสเตอร์" โดยไม่มีข้อมูลที่ทราบเกี่ยวกับข้อมูลประจำตัวของคลัสเตอร์ การรู้จำวัตถุและการวิเคราะห์ลำดับยีนเป็นสองตัวอย่างของการจัดกลุ่ม
- การลดมิติข้อมูล – การลดมิติข้อมูลจะล้างข้อมูลที่ป้อนเข้าของข้อมูลที่ซ้ำซ้อนทั้งหมด และเก็บเฉพาะส่วนที่จำเป็นเท่านั้น ดังนั้น ข้อมูลไม่เพียงแต่จะสะอาดขึ้นเท่านั้น แต่ยังลดขนาดลงด้วย ซึ่งใช้พื้นที่จัดเก็บน้อยลง
การเรียนรู้การเสริมแรง
Reinforcement Learning มีเป้าหมายเพื่อสร้างรูปแบบการเรียนรู้ด้วยตนเองอย่างยั่งยืนและสามารถเรียนรู้และปรับปรุงผ่านการลองผิดลองถูก ในกระบวนการเรียนรู้ (การฝึกอบรม) หากอัลกอริธึมสามารถดำเนินการบางอย่างได้สำเร็จ สัญญาณรางวัลจะถูกกระตุ้น สัญญาณรางวัลทำงานเหมือนกับไฟนำทางสำหรับอัลกอริทึม มีสองสัญญาณรางวัล:

- สัญญาณเชิงบวกจะถูกกระตุ้นเพื่อกระตุ้นและดำเนินการตามลำดับการกระทำที่เฉพาะเจาะจงต่อไป
- สัญญาณเชิงลบคือบทลงโทษสำหรับการกระทำผิดโดยเฉพาะ เรียกร้องให้แก้ไขข้อผิดพลาดก่อนที่จะดำเนินการต่อไปในกระบวนการฝึกอบรม
Reinforcement Learning ใช้กันอย่างแพร่หลายในวิดีโอเกม นอกจากนี้ยังเป็นกลไกที่อยู่เบื้องหลังรถยนต์ที่ขับเคลื่อนด้วยตนเอง
ภายในฟังก์ชัน 'การเรียนรู้' ของอัลกอริธึม ML
เบื้องหลังการทำงานของอัลกอริธึม ML และวิธีที่พวกเขาเรียนรู้ผ่านประสบการณ์ มีหลักการทั่วไปสามประการ
การเรียนรู้ฟังก์ชัน
ขั้นตอนแรกในกระบวนการเรียนรู้คือการที่อัลกอริทึม ML เรียนรู้เกี่ยวกับฟังก์ชันเป้าหมาย (f) ที่จับคู่ตัวแปรอินพุต (X) กับตัวแปรเอาต์พุต (Y) ได้ดีที่สุด ดังนั้น,
Y = ฉ(X).
ที่นี่ ไม่ทราบรูปแบบของฟังก์ชันเป้าหมาย (f) ดังนั้นจึงสร้างแบบจำลองการคาดการณ์
ในขั้นตอนการเรียนรู้ทั่วไปนี้ อัลกอริธึม ML จะเรียนรู้วิธีคาดการณ์ในอนาคต (Y) ตามตัวแปรอินพุตใหม่ (X) โดยธรรมชาติแล้ว กระบวนการนี้ไม่มีข้อผิดพลาด ข้อผิดพลาดที่นี่ (e) มีอยู่โดยไม่ขึ้นกับข้อมูลอินพุต (X) ดังนั้น,
Y = ฉ(X) + e
เนื่องจากข้อผิดพลาด (e) อาจไม่มีคุณลักษณะเพียงพอที่จะกำหนดลักษณะสถานการณ์การแมปจาก X ถึง Y ได้ดีที่สุด จึงเรียกว่าข้อผิดพลาดที่ลดไม่ได้ ไม่ว่าอัลกอริธึมจะประเมินฟังก์ชันเป้าหมายได้ดีเพียงใด (f) ก็ตาม คุณไม่สามารถลดข้อผิดพลาดได้ ( จ)
คาดการณ์และเรียนรู้วิธีปรับปรุง
ในจุดก่อนหน้านี้ เราเข้าใจว่าอัลกอริทึม ML เรียนรู้ฟังก์ชันเป้าหมาย (f) อย่างไร และเรารู้อยู่แล้วว่าเป้าหมายเดียวและเป้าหมายเดียวของเราที่นี่คือการค้นหาวิธีที่ดีที่สุดในการแมป Y จาก X กล่าวอีกนัยหนึ่ง เราจำเป็นต้องค้นหาวิธีที่แม่นยำที่สุดในการแมปอินพุตกับเอาต์พุต
จะมีข้อผิดพลาด (e) ใช่ แต่อัลกอริธึมต้องพยายามเข้าใจว่ามันอยู่ห่างจากเอาต์พุตที่ต้องการ (Y) มากเพียงใดและจะไปถึงได้อย่างไร ในขั้นตอนนี้ จะปรับพารามิเตอร์หรือค่าอินพุต (X) อย่างต่อเนื่องเพื่อให้ตรงกับเอาต์พุต (Y) มากที่สุด สิ่งนี้จะดำเนินต่อไปจนกว่าจะถึงรูปลักษณ์และความแม่นยำในระดับสูงกับรุ่นเอาต์พุตที่ต้องการ
วิธีการเรียนรู้การเรียนรู้ของเครื่อง – ทีละขั้นตอนแนวทางการเรียนรู้ 'Gradient Descent'
อาจเป็นจริงว่าเราประสบความสำเร็จในการสร้างเครื่อง 'อัจฉริยะ' แต่ความเร็วของการเรียนรู้ต่างกัน – เครื่องจักรมักจะทำงานช้า พวกเขาเชื่อในกระบวนการเรียนรู้ "การไล่ระดับแบบค่อยเป็นค่อยไป" - คุณไม่ก้าวกระโดดในทันที แต่คุณก้าวเท้าของทารกและค่อยๆ ลงมาจากด้านบนสุด (คำอุปมาที่นี่คือการปีนลงจากภูเขา)

ขณะลงจากภูเขา คุณต้องไม่กระโดดหรือวิ่งหรือพุ่งล้มในคราวเดียว คุณทำตามขั้นตอนที่วัดและคำนวณเพื่อลงสู่ด้านล่างได้อย่างปลอดภัยและหลีกเลี่ยงอุบัติเหตุแทน
อัลกอริธึม ML ใช้วิธีนี้ โดยจะปรับตัวเองตามพารามิเตอร์ที่เปลี่ยนแปลงอยู่เสมอ (ลองนึกภาพภูมิประเทศที่ขรุขระและยังไม่ได้สำรวจของภูเขาอีกครั้ง) เพื่อให้ได้ผลลัพธ์ที่ต้องการในที่สุด
สรุป…
เป้าหมายพื้นฐานของอัลกอริธึมแมชชีนเลิร์นนิงทั้งหมดคือการพัฒนาโมเดลการคาดการณ์ที่สรุปข้อมูลอินพุตที่เฉพาะเจาะจงได้ดีที่สุด เนื่องจากอัลกอริทึมและระบบ ML ฝึกฝนตัวเองผ่านอินพุต/ตัวแปร/พารามิเตอร์ประเภทต่างๆ จึงมีความจำเป็นที่จะต้องมีกลุ่มข้อมูลจำนวนมาก ทั้งนี้เพื่อให้อัลกอริทึม ML สามารถโต้ตอบกับข้อมูลประเภทต่างๆ เพื่อเรียนรู้พฤติกรรมและให้ผลลัพธ์ที่ต้องการ
เราหวังว่าด้วยโพสต์นี้ เราจะทำให้กระจ่างถึงการทำงานของแมชชีนเลิร์นนิงสำหรับคุณ!