การเรียนรู้ของเครื่อง Unsupervised ทำงานอย่างไร

เผยแพร่แล้ว: 2018-06-13

การเรียนรู้แบบไม่มีผู้ดูแลหมายถึงการฝึกอบรมระบบ AI โดยใช้ข้อมูลที่ไม่ได้จัดประเภทหรือติดป้ายกำกับ ความหมายในอุดมคตินี้ก็คือว่าอัลกอริธึมต้องดำเนินการกับข้อมูลโดยไม่มีคำแนะนำล่วงหน้า
ในการเรียนรู้แบบไม่มีผู้ดูแล เครื่องจะจัดกลุ่มข้อมูลที่ไม่เรียงลำดับ/ไม่เรียงลำดับเกี่ยวกับความเหมือนและความแตกต่าง สิ่งนี้ทำได้โดยไม่ต้องระบุหมวดหมู่สำหรับเครื่องเพื่อจัดหมวดหมู่ข้อมูล ระบบที่ใช้การเรียนรู้ดังกล่าวโดยทั่วไปมักเกี่ยวข้องกับรูปแบบการเรียนรู้เชิงกำเนิด

สารบัญ

การเรียนรู้ของเครื่อง Unsupervised ทำงานอย่างไร

ในการเรียนรู้แบบไม่มีผู้ดูแล ระบบ AI จะแสดงข้อมูลที่ไม่มีป้ายกำกับและไม่มีหมวดหมู่ และอัลกอริธึมของระบบจะดำเนินการกับข้อมูลโดยไม่ต้องฝึกอบรมล่วงหน้า ผลลัพธ์ขึ้นอยู่กับอัลกอริธึมที่เข้ารหัส การนำระบบไปสู่การเรียนรู้โดยไม่ได้รับการดูแลเป็นวิธีการที่กำหนดไว้ในการทดสอบความสามารถของระบบนั้น
อัลกอริธึมการเรียนรู้ที่ไม่มีผู้ดูแลสามารถดำเนินการประมวลผลที่ซับซ้อนกว่าระบบการเรียนรู้ภายใต้การดูแล อย่างไรก็ตาม การเรียนรู้โดยไม่ได้รับการดูแลอาจคาดเดาไม่ได้มากกว่ารูปแบบอื่น ระบบที่ได้รับการฝึกฝนโดยใช้แบบจำลองที่ไม่มีผู้ดูแล เช่น อาจคิดหาวิธีการแยกแยะแมวและสุนัขด้วยตัวมันเอง นอกจากนี้ยังอาจเพิ่มหมวดหมู่ที่ไม่คาดคิดและไม่ต้องการเพื่อจัดการกับสายพันธุ์ที่ผิดปกติ ซึ่งอาจจบลงด้วยการรกสิ่งของแทนที่จะเก็บไว้ใน คำสั่ง.

สำหรับอัลกอริธึมการเรียนรู้ที่ไม่มีผู้ดูแล ระบบ AI จะแสดงชุดข้อมูลที่ไม่มีป้ายกำกับและไม่มีหมวดหมู่ สิ่งที่ต้องจำไว้คือระบบนี้ไม่เคยผ่านการฝึกอบรมมาก่อน โดยพื้นฐานแล้ว การเรียนรู้แบบไม่มีผู้ดูแลสามารถถือได้ว่าเป็นการเรียนรู้โดยไม่มีครู
ในกรณีของการเรียนรู้ภายใต้การดูแล ระบบจะมีทั้งอินพุตและเอาต์พุต ดังนั้นขึ้นอยู่กับความแตกต่างระหว่างผลลัพธ์ที่ต้องการและผลลัพธ์ที่สังเกตได้ ระบบถูกตั้งค่าให้เรียนรู้และปรับปรุง อย่างไรก็ตาม ในกรณีของการเรียนรู้แบบ unsupervised ระบบจะมีเพียงอินพุตและเอาต์พุตเท่านั้น
แมชชีนเลิร์นนิงคืออะไรและเหตุใดจึงสำคัญ

การเรียนรู้แบบไม่มีผู้ดูแลมีประโยชน์อย่างมากในระหว่างงานที่เกี่ยวข้องกับการทำเหมืองข้อมูลและการแยกคุณลักษณะ เป้าหมายสูงสุดของการเรียนรู้โดยไม่ได้รับการดูแลคือการค้นหาแนวโน้มและรูปแบบที่ซ่อนอยู่ในข้อมูลหรือเพื่อดึงคุณลักษณะที่ต้องการ เช่นเดียวกับที่เรากล่าวไว้ก่อนหน้านี้ การเรียนรู้แบบไม่มีผู้ดูแลจะจัดการกับชุดข้อมูลอินพุตเท่านั้นโดยไม่มีความรู้หรือการเรียนรู้ใดๆ มาก่อน ดังนั้นจึงมีการเรียนรู้แบบ unsupervised สองประเภท:

Parametric Unsupervised Learning

Parametric unsupervised learning ถือว่ามีการกระจายข้อมูลแบบพาราเมตริก สิ่งนี้หมายความว่าอย่างไร คือการเรียนรู้แบบไม่มีผู้ดูแลประเภทนี้สันนิษฐานว่าข้อมูลมาจากประชากรที่ตามหลังการแจกแจงความน่าจะเป็นเฉพาะตามพารามิเตอร์บางตัว ในทางทฤษฎี หากเราพิจารณาการกระจายตัวแบบปกติของตระกูลของวัตถุ เราจะเห็นว่าสมาชิกทั้งหมดมีลักษณะที่คล้ายคลึงกันและถูกทำให้เป็นพารามิเตอร์โดยค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานเสมอ ซึ่งหมายความว่าถ้าเรารู้ค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐาน และถ้าการกระจายตัวเป็นปกติ เราจะสามารถหาความน่าจะเป็นของการสังเกตในอนาคตได้ง่ายมาก Parametric Unsupervised Learning นั้นยากกว่าการเรียนรู้ภายใต้การดูแลมาตรฐานมากเพราะไม่มีป้ายกำกับ ดังนั้นจึงไม่มีการวัดความแม่นยำที่กำหนดไว้ล่วงหน้าในการทดสอบเอาต์พุต

การเรียนรู้แบบไม่อยู่ภายใต้การดูแลแบบไม่ใช้พารามิเตอร์

การเรียนรู้แบบไม่อยู่ภายใต้การควบคุมแบบไม่มีพารามิเตอร์หมายถึงการจัดกลุ่มของชุดข้อมูลอินพุต โดยพื้นฐานแล้วแต่ละคลัสเตอร์จะพูดอะไรบางอย่างเกี่ยวกับหมวดหมู่และคลาสของรายการข้อมูลที่อยู่ในชุด นี่เป็นวิธีการที่ใช้บ่อยที่สุดสำหรับการสร้างแบบจำลองข้อมูลและการวิเคราะห์ข้อมูลด้วยขนาดตัวอย่างที่เล็ก เมธอดเหล่านี้เรียกอีกอย่างว่าเมธอดที่ไม่มีการแจกแจง เนื่องจากไม่เหมือนกับในกรณีของการเรียนรู้แบบพาราเมตริก ผู้สร้างโมเดลไม่จำเป็นต้องตั้งสมมติฐานใดๆ เกี่ยวกับการกระจายตัวของประชากรทั้งหมด
เทคนิคการเรียนรู้ด้วยเครื่อง 6 อย่างนี้กำลังปรับปรุงการดูแลสุขภาพ

ณ จุดนี้ จำเป็นอย่างยิ่งที่จะต้องเจาะลึกลงไปในความหมายของคลัสเตอร์

ดังนั้นการจัดกลุ่มคืออะไร?

การจัดกลุ่มเป็นหนึ่งในแนวคิดพื้นฐานที่สำคัญที่สุดเมื่อพูดถึงการเรียนรู้แบบไม่มีผู้ดูแล มันเกี่ยวข้องกับการค้นหาโครงสร้างหรือรูปแบบในการรวบรวมข้อมูลที่ไม่มีหมวดหมู่ คำจำกัดความง่ายๆ ของคลัสเตอร์อาจเป็น "กระบวนการจัดกลุ่มวัตถุเป็นคลาสต่างๆ โดยที่สมาชิกแต่ละคนในคลาสจะมีความคล้ายคลึงกันไม่ทางใดก็ทางหนึ่ง"
ดังนั้น คลัสเตอร์จึงสามารถกำหนดได้ง่ายๆ ว่าเป็นคอลเล็กชันของออบเจ็กต์ข้อมูลที่ "คล้ายกัน" ระหว่างคลัสเตอร์ และ "ไม่เหมือนกับ" กับออบเจ็กต์ของคลัสเตอร์อื่น

การประยุกต์ใช้แมชชีนเลิร์นนิงแบบไม่มีผู้ดูแล

เป้าหมายของแมชชีนเลิร์นนิงโดยไม่ได้รับการดูแลคือการเปิดเผยรูปแบบและแนวโน้มที่ซ่อนอยู่ก่อนหน้านี้ในข้อมูล แต่โดยส่วนใหญ่ รูปแบบข้อมูลเป็นการประมาณที่ไม่ดีนักว่าแมชชีนเลิร์นนิงที่ควบคุมดูแลจะบรรลุผลได้อย่างไร ตัวอย่างเช่น แบ่งลูกค้าออกเป็นกลุ่มใหญ่ แทนที่จะปฏิบัติต่อพวกเขาเหมือนเป็นรายบุคคล และมอบการสื่อสารที่เป็นส่วนตัวสูง ในกรณีของการเรียนรู้แบบไม่มีผู้ดูแล เราไม่รู้ว่าผลลัพธ์จะเป็นอย่างไร ดังนั้น หากเราต้องออกแบบแบบจำลองการทำนาย การเรียนรู้ภายใต้การดูแลจะเหมาะสมกว่าในบริบทของโลกแห่งความเป็นจริง
กรณีใช้งานในอุดมคติสำหรับการใช้แมชชีนเลิร์นนิงโดยไม่ได้รับการดูแลคือเมื่อคุณไม่มีข้อมูลเกี่ยวกับผลลัพธ์ที่ต้องการ ตัวอย่างเช่น หากคุณต้องการกำหนดตลาดเป้าหมายสำหรับผลิตภัณฑ์ใหม่ทั้งหมด อย่างไรก็ตาม หากคุณต้องการจัดหมวดหมู่ฐานผู้บริโภคของคุณให้ดีขึ้น การเรียนรู้ภายใต้การดูแลก็เป็นตัวเลือกที่ดีกว่า
5 แอปพลิเคชั่นสุดล้ำของแมชชีนเลิร์นนิง

มาดูการประยุกต์ใช้เทคนิคแมชชีนเลิร์นนิงแบบไม่มีผู้ดูแลกัน:

  1. การเรียนรู้โดยไม่ได้รับการดูแลจะเป็นประโยชน์อย่างมากสำหรับการตรวจจับความผิดปกติจากชุดข้อมูลของคุณ การตรวจจับความผิดปกติหมายถึงการค้นหาจุดข้อมูลที่สำคัญในการรวบรวมข้อมูลของคุณ สิ่งนี้มีประโยชน์มากในการค้นหาธุรกรรมที่เป็นการฉ้อโกง ค้นพบชิ้นส่วนของฮาร์ดแวร์ที่เสียหาย หรือระบุค่าผิดปกติใดๆ ที่อาจคืบคลานเข้ามาระหว่างการป้อนข้อมูล
  2. การทำเหมืองเชื่อมโยงหมายถึงการระบุชุดของรายการที่เกิดขึ้นร่วมกันในชุดข้อมูล นี่เป็นเทคนิคที่เป็นประโยชน์สำหรับการวิเคราะห์ตะกร้า เนื่องจากช่วยให้นักวิเคราะห์ค้นพบสินค้าที่ซื้อบ่อยร่วมกันได้ การทำเหมืองเชื่อมโยงเป็นไปไม่ได้หากไม่มีการจัดกลุ่มข้อมูล และเมื่อคุณพูดถึงการทำคลัสเตอร์ คุณจะพูดถึงอัลกอริธึมการเรียนรู้ของเครื่องที่ไม่มีผู้ดูแล
  3. อีกหนึ่งกรณีการใช้งานของการเรียนรู้แบบ unsupervised คือการลดขนาดลง หมายถึงการลดจำนวนคุณลักษณะในชุดข้อมูลและทำให้การประมวลผลข้อมูลล่วงหน้าดีขึ้น แบบจำลองตัวแปรแฝงมักใช้เพื่อจุดประสงค์นี้และเป็นไปได้โดยใช้อัลกอริธึมการเรียนรู้ที่ไม่มีผู้ดูแลเท่านั้น

รูปแบบและแนวโน้มที่เปิดเผยโดยใช้การเรียนรู้แบบไม่อยู่ภายใต้การดูแลยังมีประโยชน์เมื่อใช้อัลกอริธึมการเรียนรู้ภายใต้การดูแลในภายหลัง เช่น การเรียนรู้แบบไม่มีผู้ดูแลอาจช่วยให้คุณทำการวิเคราะห์คลัสเตอร์ในชุดข้อมูล จากนั้นคุณสามารถใช้การเรียนรู้ภายใต้การดูแลกับคลัสเตอร์ใดก็ได้ที่คุณเลือก/ ความต้องการ.
วิศวกรการเรียนรู้ของเครื่อง: ตำนานกับความเป็นจริง

โดยรวมแล้ว แมชชีนเลิร์นนิงและปัญญาประดิษฐ์เป็นสาขาที่ซับซ้อนอย่างเหลือเชื่อ และระบบ AI ที่ซับซ้อนใดๆ ที่คุณพบมักจะใช้อัลกอริธึมและกลไกการเรียนรู้ที่หลากหลายร่วมกัน ต้องบอกว่า หากคุณเป็นมือใหม่ คุณจำเป็นต้องรู้ประเด็นสำคัญที่เกี่ยวข้องกับเทคนิคการเรียนรู้เบื้องต้นทั้งหมด

เรียนรู้หลักสูตร ML จากมหาวิทยาลัยชั้นนำของโลก รับ Masters, Executive PGP หรือ Advanced Certificate Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว
เราหวังว่าเราจะสามารถชี้แจงประเด็นที่ละเอียดอ่อนกว่าของอัลกอริทึมการเรียนรู้ที่ไม่มีผู้ดูแลได้ หากคุณมีข้อสงสัยโปรดทิ้งไว้ในความคิดเห็นด้านล่าง!

กล่าวถึงข้อจำกัดบางประการของแมชชีนเลิร์นนิงโดยไม่ได้รับการดูแล

ในกรณีของแมชชีนเลิร์นนิงโดยไม่ได้รับการดูแล การแทรกแซงของมนุษย์อาจจำเป็นต้องเข้าใจรูปแบบที่หลากหลายและเชื่อมโยงกับความเชี่ยวชาญด้านโดเมน ซึ่งอาจมีค่าใช้จ่ายสูง ผลลัพธ์หรือสิ่งที่ค้นพบมักพบว่าไม่ถูกต้อง การเรียงลำดับและเอาต์พุตของงานที่ไม่ได้รับการดูแลนั้นไม่สามารถกำหนดได้อย่างแม่นยำ ขึ้นอยู่กับรุ่นและด้วยเหตุนี้จึงขึ้นอยู่กับเครื่อง นอกจากนี้ยังไม่ทราบจำนวนหลักสูตรทั้งหมด ด้วยเหตุนี้ ข้อสรุปของการวิเคราะห์จึงยากต่อการตรวจสอบ

กฎการเชื่อมโยงในแมชชีนเลิร์นนิงแบบไม่มีผู้ดูแลคืออะไร

กฎการเชื่อมโยงเป็นหนึ่งในวิธีการเรียนรู้ของเครื่องที่ไม่ได้รับการดูแล คุณสามารถสร้างความสัมพันธ์ระหว่างองค์ประกอบข้อมูลในฐานข้อมูลขนาดใหญ่ได้โดยใช้กฎการเชื่อมโยง การค้นพบความสัมพันธ์ที่น่าสนใจระหว่างตัวแปรในฐานข้อมูลขนาดใหญ่เป็นเป้าหมายของแนวทาง/อัลกอริทึมที่ไม่ได้รับการดูแล กฎการเชื่อมโยงคือชุดของแนวทางที่ใช้ในการเสนอฐานที่ยอดเยี่ยมสำหรับการสร้างการคาดการณ์ทุกประเภทและการประเมินโอกาสของเหตุการณ์บางอย่างที่เกิดขึ้นเหนือผู้อื่น