วิธีเข้าถึงปัญหาการเรียนรู้ของเครื่อง

เผยแพร่แล้ว: 2022-03-11

งานหลักของคอมพิวเตอร์อย่างหนึ่งคือการทำให้งานของมนุษย์เป็นไปโดยอัตโนมัติ งานเหล่านี้บางส่วนเรียบง่ายและซ้ำซาก เช่น "ย้าย X จาก A ไป B" น่าสนใจยิ่งขึ้นเมื่อคอมพิวเตอร์ต้องตัดสินใจเกี่ยวกับปัญหาที่ยากต่อการทำให้เป็นทางการมากขึ้น นั่นคือจุดที่เราเริ่มพบปัญหาการเรียนรู้ของเครื่องขั้นพื้นฐาน

ภาพประกอบปัญหาการเรียนรู้ของเครื่อง

ในอดีต อัลกอริธึมดังกล่าวถูกสร้างขึ้นโดยนักวิทยาศาสตร์หรือผู้เชี่ยวชาญที่มีความรู้เชิงลึกในสาขาของตนและส่วนใหญ่อยู่บนพื้นฐานของกฎเกณฑ์ ด้วยการระเบิดของพลังการประมวลผลและความพร้อมใช้งานของชุดข้อมูลขนาดใหญ่และหลากหลาย จุดเน้นได้เปลี่ยนไปสู่แนวทางการคำนวณที่มากขึ้น

แนวคิดแมชชีนเลิร์นนิงที่โด่งดังที่สุดในปัจจุบันเกี่ยวข้องกับโครงข่ายประสาทเทียม และจากประสบการณ์ของฉัน สิ่งนี้สร้างความประทับใจให้กับผู้คนจำนวนมากว่าโครงข่ายประสาทเทียมเป็นอาวุธมหัศจรรย์สำหรับปัญหาการอนุมานทั้งหมด อันที่จริงนี่ค่อนข้างไกลจากความจริง ในสายตาของนักสถิติ พวกเขาสร้างวิธีการอนุมานประเภทหนึ่งที่มีจุดแข็งและจุดอ่อนที่เกี่ยวข้องกัน และมันทั้งหมดขึ้นอยู่กับปัญหาว่าโครงข่ายประสาทเทียมจะเป็นทางออกที่ดีที่สุดหรือไม่

มักมีแนวทางที่ดีกว่า

ในบทความนี้ เราจะสรุปโครงสร้างการโจมตีปัญหาการเรียนรู้ของเครื่อง ไม่มีขอบเขตในการลงรายละเอียดมากเกินไปเกี่ยวกับโมเดลการเรียนรู้ของเครื่องโดยเฉพาะ แต่ถ้าบทความนี้สร้างความสนใจ บทความต่อๆ ไปอาจเสนอวิธีแก้ปัญหาโดยละเอียดสำหรับปัญหาการเรียนรู้ของเครื่องที่น่าสนใจบางอย่าง

อย่างไรก็ตาม อันดับแรก ให้เราพยายามแสดงให้เห็นว่าเหตุใดคุณจึงควรระมัดระวังมากกว่าที่จะคิดว่า "โครงข่ายประสาทเทียม" โดยอัตโนมัติเมื่อต้องเผชิญกับปัญหาการเรียนรู้ของเครื่อง

ข้อดีและข้อเสียของโครงข่ายประสาทเทียม

ด้วยโครงข่ายประสาทเทียม การอนุมานทำได้ผ่าน "เครือข่าย" ที่ถ่วงน้ำหนัก ตุ้มน้ำหนักจะถูกปรับเทียบในระหว่างกระบวนการที่เรียกว่า "การเรียนรู้" จากนั้นจึงนำไปใช้เพื่อกำหนดผลลัพธ์ให้กับอินพุต

ฟังดูง่าย ตุ้มน้ำหนักทั้งหมดเป็นพารามิเตอร์สำหรับเครือข่ายที่สอบเทียบ และโดยปกติแล้ว นั่นหมายถึงพารามิเตอร์มากเกินไปที่มนุษย์จะเข้าใจได้

ภาพประกอบอินพุต - เอาท์พุตทฤษฎีโครงข่ายประสาท

ดังนั้นเราจึงอาจพิจารณาโครงข่ายประสาทเสมือนเป็นกล่องดำอนุมานบางประเภทที่เชื่อมต่ออินพุตกับเอาต์พุต โดยไม่มีโมเดลเฉพาะเจาะจงในระหว่างนั้น

ให้เราพิจารณาข้อดีข้อเสียของแนวทางนี้อย่างละเอียดยิ่งขึ้น

ข้อดีของโครงข่ายประสาทเทียม

  • ข้อมูลเข้าคือตัวข้อมูลเอง ผลลัพธ์ที่ใช้งานได้แม้มีวิศวกรรมคุณลักษณะเพียงเล็กน้อยหรือไม่มีเลย
  • ทักษะที่สามารถฝึกฝนได้ หากไม่มีวิศวกรรมคุณลักษณะ ไม่จำเป็นต้องมีทักษะที่ยากต่อการพัฒนา เช่น ปรีชาญาณหรือความเชี่ยวชาญด้านโดเมน มีเครื่องมือมาตรฐานสำหรับการอนุมานทั่วไป
  • ความแม่นยำเพิ่มขึ้นด้วยปริมาณข้อมูล ยิ่งเห็นอินพุตมากเท่าไร โครงข่ายประสาทเทียมก็จะยิ่งทำงานได้ดีขึ้นเท่านั้น
  • อาจทำผลงานได้ดีกว่าโมเดลคลาสสิก เมื่อไม่มีข้อมูลที่สมบูรณ์เกี่ยวกับโมเดล ลองนึกถึงความรู้สึกสาธารณะอย่างหนึ่ง
  • การอนุมานปลายเปิดสามารถค้นพบรูปแบบที่ไม่รู้จัก หากคุณใช้แบบจำลองและไม่คำนึงถึงมัน แบบจำลองนั้นจะไม่ตรวจพบปรากฏการณ์ที่เกี่ยวข้อง โครงข่ายประสาทเทียมอาจ

ตัวอย่างโครงข่ายประสาทที่ประสบความสำเร็จ: AI ของ Google พบดาวเคราะห์ดวงหนึ่งโคจรรอบดาวฤกษ์ที่อยู่ห่างไกล ซึ่ง NASA ไม่ได้ทำ โดยการวิเคราะห์ข้อมูลกล้องโทรทรรศน์ที่สะสมไว้

ข้อเสียของโครงข่ายประสาทเทียม

  • พวกเขาต้องการข้อมูล (มีคำอธิบายประกอบ!) จำนวนมาก ประการแรก ข้อมูลจำนวนนี้อาจไม่พร้อมใช้งานเสมอไป การบรรจบกันช้า แบบจำลองที่เป็นของแข็ง (เช่น ในวิชาฟิสิกส์) สามารถปรับเทียบได้หลังจากการสังเกตสองสามครั้ง—ด้วยโครงข่ายประสาทเทียม สิ่งนี้ไม่เป็นปัญหา คำอธิบายประกอบเป็นงานที่ต้องทำมาก ไม่ต้องพูดถึงว่าคำอธิบายประกอบนั้นไม่สามารถเข้าใจผิดได้
  • ไม่มีข้อมูลเกี่ยวกับโครงสร้างภายในของข้อมูล คุณสนใจว่าการอนุมานอิงจากอะไร? ไม่มีโชคที่นี่ มีบางสถานการณ์ที่การปรับข้อมูลด้วยตนเองช่วยปรับปรุงการอนุมานได้ด้วยการก้าวกระโดด แต่โครงข่ายประสาทเทียมจะไม่สามารถช่วยได้
  • ปัญหาการโอเวอร์คล็อก บ่อยครั้งที่เครือข่ายมีพารามิเตอร์มากกว่าข้อมูลที่สมเหตุสมผล ซึ่งนำไปสู่การอนุมานที่ไม่เหมาะสม
  • ประสิทธิภาพขึ้นอยู่กับข้อมูล หากมีข้อมูลทั้งหมดเกี่ยวกับปัญหา แบบจำลองที่มั่นคงมักจะมีประสิทธิภาพเหนือกว่าโครงข่ายประสาทเทียม
  • มีปัญหาในการสุ่มตัวอย่าง การสุ่มตัวอย่างเป็นปัญหาที่ละเอียดอ่อนเสมอ แต่ด้วยแบบจำลอง เราสามารถพัฒนาแนวคิดเรื่องการสุ่มตัวอย่างที่มีปัญหาได้อย่างรวดเร็ว โครงข่ายประสาทเทียมเรียนรู้จากข้อมูลเท่านั้น ดังนั้นหากได้รับข้อมูลที่มีอคติ ก็จะได้ข้อสรุปแบบมีอคติ

ตัวอย่างของความล้มเหลว: ความสัมพันธ์ส่วนตัวบอกฉันถึงบริษัทใหญ่ (ที่ฉันไม่สามารถตั้งชื่อได้) ที่ทำงานเกี่ยวกับการตรวจจับยานพาหนะทางทหารบนภาพถ่ายทางอากาศ พวกเขามีภาพที่มียานพาหนะดังกล่าวและอื่น ๆ ที่ไม่มี ภาพส่วนใหญ่ในชั้นเรียนเดิมถ่ายในวันที่ฝนตก ขณะที่ภาพหลังถ่ายในสภาพอากาศที่มีแดดจัด เป็นผลให้ระบบเรียนรู้ที่จะแยกแยะแสงจากเงา

โดยสรุป โครงข่ายประสาทเทียมสร้างวิธีการอนุมานประเภทหนึ่งซึ่งมีข้อดีและข้อเสีย

ความจริงที่ว่าความนิยมของพวกเขาโดดเด่นกว่าวิธีการทางสถิติอื่น ๆ ทั้งหมดในสายตาของสาธารณชนมีแนวโน้มที่จะเกี่ยวข้องกับการกำกับดูแลกิจการมากกว่าสิ่งอื่นใด

การฝึกอบรมผู้คนให้ใช้เครื่องมือมาตรฐานและวิธีการโครงข่ายประสาทเทียมที่เป็นมาตรฐานนั้นเป็นกระบวนการที่คาดเดาได้ง่ายกว่าการตามล่าผู้เชี่ยวชาญและศิลปินจากสาขาต่างๆ อย่างไรก็ตาม สิ่งนี้ไม่ได้เปลี่ยนความจริงที่ว่าการใช้โครงข่ายประสาทเทียมสำหรับปัญหาง่ายๆ ที่มีการกำหนดไว้อย่างชัดเจนนั้นเป็นเพียงการยิงนกกระจอกด้วยปืนใหญ่ ต้องใช้ข้อมูลจำนวนมาก ต้องใช้คำอธิบายประกอบจำนวนมาก และอาจในทางกลับกัน ประสิทธิภาพต่ำกว่าเมื่อเทียบกับรุ่นที่มั่นคง ไม่ใช่แพ็คเกจที่ดีที่สุด

ยังคงมีอำนาจมหาศาลในข้อเท็จจริงที่ว่าพวกเขา "ทำให้เป็นประชาธิปไตย" ความรู้ทางสถิติ เมื่อโซลูชันการอนุมานบนโครงข่ายประสาทเทียมถูกมองว่าเป็นเครื่องมือการเขียนโปรแกรมเพียงอย่างเดียว อาจช่วยแม้กระทั่งผู้ที่รู้สึกไม่สบายใจกับอัลกอริทึมที่ซับซ้อน ดังนั้น หลายสิ่งหลายอย่างจึงถูกสร้างขึ้นมาอย่างหลีกเลี่ยงไม่ได้ หากเราใช้งานเฉพาะกับโมเดลที่ซับซ้อนเท่านั้น

กำลังเข้าใกล้ปัญหาการเรียนรู้ของเครื่อง

เมื่อเผชิญกับปัญหาการเรียนรู้ของเครื่อง สิ่งเหล่านี้คือขั้นตอนที่คุณต้องดำเนินการ:

  • การกำหนดเกณฑ์การยอมรับ
  • การล้างข้อมูลของคุณและเพิ่มเนื้อหาข้อมูล ist ให้สูงสุด
  • การเลือกวิธีการอนุมานที่เหมาะสมที่สุด
  • ฝึกฝน ทดสอบ ทำซ้ำ

ให้เราดูรายการเหล่านี้ในรายละเอียด

ขั้นตอนต่างๆ ของปัญหาการเรียนรู้ของเครื่อง

กำหนดเกณฑ์การรับ

คุณควรมีแนวคิดเกี่ยวกับความแม่นยำของเป้าหมายโดยเร็วที่สุดเท่าที่เป็นไปได้ นี่จะเป็นเป้าหมายที่คุณทำงานต่อไป

การล้างข้อมูลของคุณและเพิ่มเนื้อหาข้อมูลให้สูงสุด

นี่เป็นขั้นตอนที่สำคัญที่สุด ก่อนอื่น ข้อมูลของคุณไม่ควรมีข้อผิดพลาด (หรือน้อย) การทำความสะอาดสิ่งเหล่านี้เป็นขั้นตอนแรกที่สำคัญ แทนที่ค่าที่หายไป พยายามระบุรูปแบบที่เห็นได้ชัดว่าเป็นการหลอกลวง กำจัดค่าที่ซ้ำกันและความผิดปกติอื่นๆ ที่คุณอาจสังเกตเห็น

สำหรับข้อมูล หากข้อมูลของคุณให้ข้อมูลมาก (ในแง่เชิงเส้น) วิธีการอนุมานในทางปฏิบัติใดๆ ก็ตามจะให้ผลลัพธ์ที่ดี หากข้อมูลที่ต้องการไม่อยู่ในนั้น ผลลัพธ์จะเป็นสัญญาณรบกวน การเพิ่มข้อมูลให้สูงสุดหมายถึงการค้นหาความสัมพันธ์ที่ไม่เป็นเชิงเส้นที่เป็นประโยชน์ในข้อมูลเป็นหลักและการทำให้เป็นเส้นตรง หากนั่นช่วยปรับปรุงปัจจัยการผลิตอย่างมากก็เยี่ยมมาก หากไม่เป็นเช่นนั้น อาจต้องเพิ่มตัวแปรเพิ่มเติม หากทั้งหมดนี้ไม่ได้ผล ความแม่นยำของเป้าหมายอาจลดลง

ถ้าโชคดีจะมีตัวแปรเดียวที่เป็นประโยชน์ คุณสามารถระบุตัวแปรที่มีประโยชน์ได้ ตัวอย่างเช่น หากคุณพล็อตเทียบกับตัวแปรเป้าหมายการเรียนรู้ และพบว่าโครงเรื่องมีลักษณะการทำงาน (เช่น ช่วงแคบในอินพุตสอดคล้องกับช่วงแคบในเอาต์พุต) ตัวแปรนี้สามารถทำให้เป็นเส้นตรงได้—ตัวอย่างเช่น หากแปลงเป็นพาราโบลา ให้ลบค่าบางค่าออกแล้วหารากที่สอง

สำหรับตัวแปรที่มีสัญญาณรบกวน—ช่วงอินพุตที่แคบจะสอดคล้องกับช่วงเอาต์พุตที่กว้าง—เราอาจลองรวมตัวแปรเหล่านี้กับตัวแปรอื่นๆ

เพื่อให้เข้าใจถึงความถูกต้องแม่นยำ คุณอาจต้องการวัดความน่าจะเป็นของคลาสแบบมีเงื่อนไขสำหรับตัวแปรแต่ละตัวของคุณ (สำหรับปัญหาการจำแนกประเภท) หรือใช้รูปแบบการถดถอยแบบง่ายๆ เช่น การถดถอยเชิงเส้น (สำหรับปัญหาการทำนาย) หากเนื้อหาข้อมูลของอินพุตดีขึ้น การอนุมานของคุณก็เช่นกัน และคุณไม่ต้องการเสียเวลามากเกินไปในขั้นตอนนี้ในการปรับเทียบแบบจำลองเมื่อข้อมูลยังไม่พร้อม ดังนั้นให้ทำการทดสอบให้ง่ายที่สุดเท่าที่จะทำได้

การเลือกวิธีการอนุมานที่เหมาะสมที่สุด

เมื่อข้อมูลของคุณอยู่ในรูปแบบที่เหมาะสมแล้ว คุณสามารถใช้วิธีการอนุมานได้ (ข้อมูลอาจยังคงได้รับการขัดเกลาในภายหลัง หากจำเป็น)

คุณควรใช้โมเดลหรือไม่? ถ้าคุณมีเหตุผลที่ดีที่จะเชื่อว่าคุณสามารถสร้างแบบจำลองที่ดีสำหรับงานนี้ได้ คุณก็ควรทำแบบนั้น หากคุณไม่คิดอย่างนั้น แต่มีข้อมูลเพียงพอพร้อมคำอธิบายประกอบที่ดี คุณอาจใช้โครงข่ายประสาทเทียมแบบแฮนด์ฟรี อย่างไรก็ตาม ในแอปพลิเคชันการเรียนรู้ของเครื่องในทางปฏิบัติ มักมีข้อมูลไม่เพียงพอสำหรับสิ่งนั้น

การเล่นที่แม่นยำกับการปกปิดมักจะให้ผลตอบแทนมหาศาล วิธีการแบบไฮบริดมักจะใช้ได้ดี สมมติว่าข้อมูลเป็นเช่นนั้นคุณจะได้รับความแม่นยำเกือบ 100% จาก 80% ด้วยแบบจำลองง่ายๆ? ซึ่งหมายความว่าคุณสามารถพิสูจน์ผลลัพธ์ได้อย่างรวดเร็ว และหากระบบของคุณสามารถระบุได้ว่าเมื่อใดที่ทำงานในพื้นที่ที่เป็นมิตร 80% แสดงว่าคุณครอบคลุมปัญหาส่วนใหญ่แล้วโดยพื้นฐาน ลูกค้าของคุณอาจยังไม่พึงพอใจอย่างเต็มที่ แต่สิ่งนี้จะทำให้คุณได้รับความเชื่อถืออย่างรวดเร็ว และไม่มีอะไรที่จะขัดขวางไม่ให้คุณทำสิ่งที่คล้ายคลึงกันกับข้อมูลที่เหลือ: ด้วยความพยายามที่สมเหตุสมผลในตอนนี้ คุณครอบคลุม 92% ของข้อมูลที่มีความแม่นยำ 97% จริงอยู่ที่ข้อมูลที่เหลือเป็นการพลิกเหรียญ แต่คุณได้สร้างสิ่งที่มีประโยชน์แล้ว

สำหรับการใช้งานจริงส่วนใหญ่ สิ่งนี้มีประโยชน์มาก สมมติว่าคุณอยู่ในธุรกิจการให้กู้ยืมและต้องการตัดสินใจว่าจะให้เงินกู้แก่ใคร และทั้งหมดที่คุณทราบก็คือ 70% ของลูกค้าอัลกอริธึมของคุณแม่นยำมาก เยี่ยม—จริง อีก 30% ของผู้สมัครของคุณจะต้องดำเนินการเพิ่มเติม แต่ 70% สามารถดำเนินการอัตโนมัติทั้งหมดได้ หรือ: สมมติว่าคุณกำลังพยายามทำให้โอเปอเรเตอร์ทำงานอัตโนมัติสำหรับคอลเซ็นเตอร์ คุณสามารถทำงานได้ดี (รวดเร็วและสกปรก) เฉพาะงานที่ง่ายที่สุดเท่านั้น แต่งานเหล่านี้ครอบคลุม 50% ของการโทรหรือไม่ เยี่ยมมาก ศูนย์บริการประหยัดเงินหากสามารถโทรอัตโนมัติได้ 50% อย่างน่าเชื่อถือ

สรุป: หากข้อมูลไม่เพียงพอหรือปัญหาซับซ้อนเกินกว่าจะจัดการได้อย่างครบถ้วน ให้คิดนอกกรอบ ระบุปัญหาย่อยที่เป็นประโยชน์และแก้ปัญหาได้ง่าย จนกว่าคุณจะมีความคิดที่ดีขึ้น

เมื่อคุณเตรียมระบบของคุณให้พร้อมแล้ว ให้เรียนรู้ ทดสอบ และวนซ้ำจนกว่าคุณจะพอใจกับผลลัพธ์

ฝึกฝน ทดสอบ ทำซ้ำ

หลังจากขั้นตอนก่อนหน้านี้ ความสนใจก็เหลือเพียงเล็กน้อย คุณมีข้อมูล คุณมีวิธีการเรียนรู้ของเครื่อง ดังนั้นถึงเวลาแยกพารามิเตอร์ผ่านการเรียนรู้ แล้วทดสอบการอนุมานในชุดการทดสอบ วรรณกรรมแนะนำว่า 70% ของบันทึกควรใช้สำหรับการฝึกอบรม และ 30% สำหรับการทดสอบ

หากคุณพอใจกับผลลัพธ์ แสดงว่างานเสร็จสิ้นแล้ว แต่มีแนวโน้มมากกว่าที่คุณพัฒนาแนวคิดใหม่ ๆ ในระหว่างกระบวนการ สิ่งเหล่านี้สามารถช่วยให้คุณยกระดับความแม่นยำได้ บางทีคุณอาจต้องการข้อมูลเพิ่มเติม? หรือเพียงแค่ล้างข้อมูลมากขึ้น? หรือรุ่นอื่น? ไม่ว่าจะด้วยวิธีใด โอกาสที่คุณจะยุ่งอยู่พักหนึ่ง

ดังนั้น ขอให้โชคดีและสนุกกับงานข้างหน้า!

ที่เกี่ยวข้อง:
  • เครื่องจักรและความน่าเชื่อถือ: วิธีลดอคติของ AI
  • จัดตำแหน่งดาวใหม่: การปรับปรุงระบบการจัดระดับ IMDb