ประเภทของอัลกอริทึมปัญญาประดิษฐ์ที่คุณควรทราบ [คู่มือฉบับสมบูรณ์]

เผยแพร่แล้ว: 2019-11-13

ปัญญาประดิษฐ์ ได้เติบโตขึ้นและมีผลกระทบอย่างมากต่อโลก ด้วยข้อมูลจำนวนมากที่สร้างขึ้นโดยแอปพลิเคชันและแหล่งที่มาต่างๆ ระบบการเรียนรู้ของเครื่องจึงสามารถเรียนรู้จากข้อมูลการทดสอบและทำงานที่ชาญฉลาดได้

ปัญญาประดิษฐ์เป็นสาขาของวิทยาการคอมพิวเตอร์ที่เกี่ยวข้องกับการให้ความสามารถชี้ขาดและความสามารถในการคิดของเครื่องจักร ปัญญาประดิษฐ์จึงเป็นการผสมผสานระหว่างวิทยาการคอมพิวเตอร์ การวิเคราะห์ข้อมูล และคณิตศาสตร์ล้วนๆ

แมชชีนเลิร์นนิงกลายเป็นส่วนสำคัญของปัญญาประดิษฐ์ และเกี่ยวข้องกับส่วนแรกเท่านั้น กระบวนการเรียนรู้จากข้อมูลที่ป้อนเข้า ปัญญาประดิษฐ์และประโยชน์ของมันไม่เคยหยุดทำให้เราประหลาดใจ

เข้าร่วม หลักสูตร AI ออนไลน์จากมหาวิทยาลัยชั้นนำของโลก – ปริญญาโท, หลักสูตร Executive Post Graduate และหลักสูตรประกาศนียบัตรขั้นสูงใน ML & AI เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

สารบัญ

ประเภทของอัลกอริทึมปัญญาประดิษฐ์
- 1. อัลกอริทึมการจำแนกประเภท
  - ก) อ่าวไร้เดียงสา
  - b) โครงสร้างการตัดสินใจ
  - ค) ป่าสุ่ม
  - d) รองรับ Vector Machines
  - จ) K เพื่อนบ้านที่ใกล้ที่สุด
- 2. อัลกอริทึมการถดถอย
  - ก) การถดถอยเชิงเส้น
  - b) การถดถอยแบบ Lasso
  - c) การถดถอยโลจิสติก
  - d) การถดถอยหลายตัวแปร
  - e) อัลกอริธึมการถดถอยพหุคูณ
- 3. อัลกอริธึมการจัดกลุ่ม
  - ก) การจัดกลุ่ม K-Means
  - b) Fuzzy C-mean Algorithm
  - ค) ความคาดหวัง-Maximisation (EM) อัลกอริธึม
  - d) อัลกอริธึมคลัสเตอร์แบบลำดับชั้น
มาปิดท้ายกัน
อ่าวไร้เดียงสาคืออะไร?
ต้นไม้ตัดสินใจคืออะไร?
เครื่องสนับสนุนเวกเตอร์คืออะไร?

ประเภทของอัลกอริทึมปัญญาประดิษฐ์

อัลกอริธึมปัญญาประดิษฐ์สามารถจำแนกได้กว้าง ๆ ดังนี้:

1. อัลกอริทึมการจำแนกประเภท

อัลกอริทึมการจำแนกเป็นส่วนหนึ่งของการเรียนรู้ภายใต้การดูแล อัลกอริธึมเหล่านี้ใช้เพื่อแบ่งตัวแปร subject ออกเป็นคลาสต่างๆ แล้วทำนายคลาสสำหรับอินพุตที่กำหนด ตัวอย่างเช่น สามารถใช้อัลกอริธึมการจัดประเภทเพื่อจัดประเภทอีเมลเป็นสแปมหรือไม่ มาพูดถึงอัลกอริธึมการจำแนกประเภทที่ใช้กันทั่วไปกัน

ก) อ่าวไร้เดียงสา

อัลกอริธึม Naive Bayes ทำงานบนทฤษฎีบท Bayes และใช้แนวทางความน่าจะเป็น ซึ่งแตกต่างจากอัลกอริธึมการจำแนกประเภทอื่นๆ อัลกอริทึมมีชุดของความน่าจะเป็นก่อนหน้าสำหรับแต่ละชั้นเรียน เมื่อป้อนข้อมูลแล้ว อัลกอริธึมจะอัปเดตความน่าจะเป็นเหล่านี้เพื่อสร้างสิ่งที่เรียกว่าความน่าจะเป็นภายหลัง สิ่งนี้มีประโยชน์เมื่อคุณต้องการทำนายว่าอินพุตนั้นเป็นของรายการคลาสที่กำหนดหรือไม่

b) โครงสร้างการตัดสินใจ

อัลกอริธึมแผนผังการตัดสินใจเป็นแผนผังลำดับงานมากกว่าเหมือนอัลกอริธึมที่โหนดแสดงการทดสอบบนแอตทริบิวต์อินพุตและกิ่งก้านแสดงถึงผลลัพธ์ของการทดสอบ

ค) ป่าสุ่ม

ป่าสุ่มทำงานเหมือนกลุ่มต้นไม้ ชุดข้อมูลที่ป้อนเข้าจะถูกแบ่งย่อยและป้อนเข้าในแผนผังการตัดสินใจที่แตกต่างกัน พิจารณาค่าเฉลี่ยของผลลัพธ์จากทรีการตัดสินใจทั้งหมด ฟอเรสต์สุ่มเสนอตัวแยกประเภทที่แม่นยำกว่าเมื่อเปรียบเทียบกับอัลกอริธึมทรีการตัดสินใจ

d) รองรับ Vector Machines

SVM เป็นอัลกอริทึมที่จัดประเภทข้อมูลโดยใช้ไฮเปอร์เพลน ตรวจสอบให้แน่ใจว่าระยะห่างระหว่างไฮเปอร์เพลนและเวกเตอร์สนับสนุนนั้นสูงสุด

จ) K เพื่อนบ้านที่ใกล้ที่สุด

อัลกอริทึม KNN ใช้จุดข้อมูลจำนวนมากที่แยกออกเป็นคลาสต่างๆ เพื่อทำนายคลาสของจุดข้อมูลตัวอย่างใหม่ เรียกว่า “Lazy Learning Algorithm” เพราะมันสั้นเมื่อเทียบกับอัลกอริธึมอื่นๆ

2. อัลกอริทึมการถดถอย

อัลกอริธึมการถดถอยเป็นอัลกอริธึมที่ได้รับความนิยมภายใต้อัลกอริธึมการเรียนรู้ของเครื่องภายใต้การดูแล อัลกอริธึมการถดถอยสามารถทำนายค่าเอาต์พุตตามจุดข้อมูลอินพุตที่ป้อนในระบบการเรียนรู้ แอปพลิเคชันหลักของอัลกอริธึมการถดถอยประกอบด้วยการทำนายราคาหุ้น การพยากรณ์สภาพอากาศ ฯลฯ อัลกอริธึมที่พบบ่อยที่สุดภายใต้ส่วนนี้คือ

ก) การถดถอยเชิงเส้น

ใช้เพื่อวัดคุณภาพของแท้โดยพิจารณาจากตัวแปรที่สอดคล้องกัน มันเป็นอัลกอริธึมการถดถอยที่ง่ายที่สุด แต่สามารถใช้ได้เฉพาะในกรณีของความสัมพันธ์เชิงเส้นหรือปัญหาที่แยกเชิงเส้นได้ อัลกอริทึมจะวาดเส้นตรงระหว่างจุดข้อมูลที่เรียกว่าเส้นที่พอดีที่สุดหรือเส้นถดถอย และใช้เพื่อทำนายค่าใหม่

อ่าน: การถดถอยเชิงเส้น – คำถามและคำตอบสัมภาษณ์ ML

b) การถดถอยแบบ Lasso

อัลกอริธึมการถดถอยแบบ Lasso ทำงานโดยรับชุดย่อยของตัวทำนายที่ลดข้อผิดพลาดในการทำนายสำหรับตัวแปรตอบสนอง ซึ่งทำได้โดยการกำหนดข้อจำกัดในจุดข้อมูลและยอมให้บางจุดลดขนาดลงเหลือค่าศูนย์

c) การถดถอยโลจิสติก

ส่วนใหญ่ใช้การถดถอยโลจิสติกสำหรับการจำแนกประเภทไบนารี วิธีนี้ช่วยให้คุณวิเคราะห์ชุดของตัวแปรและทำนายผลลัพธ์ตามหมวดหมู่ได้ การใช้งานหลักรวมถึงการทำนายมูลค่าตลอดช่วงชีวิตของลูกค้า มูลค่าบ้าน ฯลฯ

d) การถดถอยหลายตัวแปร

ต้องใช้อัลกอริทึมนี้เมื่อมีตัวแปรทำนายมากกว่าหนึ่งตัว อัลกอริธึมนี้ถูกใช้อย่างกว้างขวางในเครื่องมือแนะนำผลิตภัณฑ์ภาคการขายปลีก โดยที่ผลิตภัณฑ์ที่ต้องการของลูกค้าจะขึ้นอยู่กับปัจจัยหลายประการ เช่น แบรนด์ คุณภาพ ราคา รีวิว ฯลฯ

e) อัลกอริธึมการถดถอยพหุคูณ

อัลกอริธึมการถดถอยพหุคูณใช้การรวมกันของอัลกอริธึมการถดถอยเชิงเส้นและการถดถอยที่ไม่ใช่เชิงเส้นโดยใช้ตัวแปรอธิบายหลายตัวเป็นอินพุต แอปพลิเคชันหลัก ได้แก่ การวิจัยทางสังคมศาสตร์ ความถูกต้องของการเคลมประกัน การวิเคราะห์พฤติกรรม ฯลฯ

3. อัลกอริธึมการจัดกลุ่ม

การทำคลัสเตอร์เป็นกระบวนการของการแยกและจัดระเบียบจุดข้อมูลออกเป็นกลุ่มตามความคล้ายคลึงกันภายในสมาชิกของกลุ่ม นี่เป็นส่วนหนึ่งของการเรียนรู้แบบไม่มีผู้ดูแล จุดมุ่งหมายหลักคือการจัดกลุ่มรายการที่คล้ายคลึงกัน ตัวอย่างเช่น สามารถจัดการธุรกรรมที่มีลักษณะเป็นการฉ้อโกงทั้งหมดร่วมกันตามคุณสมบัติบางอย่างในธุรกรรม ด้านล่างนี้คืออัลกอริธึมการจัดกลุ่มที่พบบ่อยที่สุด

ก) การจัดกลุ่ม K-Means

เป็นอัลกอริธึมการเรียนรู้ที่ไม่มีผู้ดูแลที่ง่ายที่สุด อัลกอริทึมจะรวบรวมข้อมูลที่คล้ายคลึงกันและรวมเข้าด้วยกันเป็นคลัสเตอร์ การจัดกลุ่มทำได้โดยการคำนวณจุดศูนย์กลางของกลุ่มจุดข้อมูล จากนั้นจึงประเมินระยะห่างของแต่ละจุดข้อมูลจากจุดศูนย์กลางของคลัสเตอร์ จากนั้นกำหนดจุดข้อมูลที่วิเคราะห์โดยอิงตามระยะทางไปยังคลัสเตอร์ที่ใกล้ที่สุด 'K' ในภาษา K หมายถึงจำนวนคลัสเตอร์ที่จุดข้อมูลกำลังจัดกลุ่มอยู่

b) Fuzzy C-mean Algorithm

อัลกอริทึม FCM ทำงานบนความน่าจะเป็น แต่ละจุดข้อมูลจะถือว่ามีความเป็นไปได้ที่จะเป็นของอีกคลัสเตอร์หนึ่ง จุดข้อมูลไม่มีการเป็นสมาชิกแบบสัมบูรณ์บนคลัสเตอร์ใดคลัสเตอร์หนึ่ง และนี่คือสาเหตุที่อัลกอริทึมเรียกว่าคลุมเครือ

ค) ความคาดหวัง-Maximisation (EM) อัลกอริธึม

มันขึ้นอยู่กับการแจกแจงแบบเกาส์เซียนที่เราเรียนรู้ในสถิติ ข้อมูลถูกแสดงในรูปแบบการแจกแจงแบบเกาส์เซียนเพื่อแก้ปัญหา หลังจากกำหนดความน่าจะเป็นแล้ว ตัวอย่างจุดจะคำนวณจากสมการความคาดหวังและการเพิ่มจำนวนสูงสุด

d) อัลกอริธึมคลัสเตอร์แบบลำดับชั้น

อัลกอริธึมเหล่านี้จัดเรียงคลัสเตอร์ตามลำดับชั้นหลังจากเรียนรู้จุดข้อมูลและทำการสังเกตความคล้ายคลึงกัน สามารถเป็นได้สองประเภท

การแบ่งกลุ่มแบบแบ่งกลุ่มสำหรับแนวทางจากบนลงล่าง
การรวมกลุ่มแบบ Agglomerative สำหรับแนวทางจากล่างขึ้นบน

มาปิดท้ายกัน

AI ได้ทำให้โลกตกใจหลายครั้งและมีการใช้งานมากมายในโลกแห่งความเป็นจริงเพื่อแก้ปัญหาที่ซับซ้อน เราหวังว่าบทความนี้จะให้ความกระจ่างเกี่ยวกับอัลกอริธึมปัญญาประดิษฐ์ต่างๆ และการจำแนกประเภทกว้างๆ อัลกอริทึมจะถูกเลือกตามความต้องการและลักษณะของจุดข้อมูลที่เรามี

อัลกอริทึมมีข้อดีและข้อเสียในแง่ของความแม่นยำ ประสิทธิภาพ และเวลาในการประมวลผล นี่เป็นเพียงไม่กี่อัลกอริธึม หากคุณอยากเรียนรู้เพิ่มเติม ลองดู Executive PG Program ของ upGrad & IIIT-B ใน Machine Learning & AI

อ่าวไร้เดียงสาคืออะไร?

ทฤษฎีบท Bayes ใช้ในอัลกอริธึม Naive Bayes ซึ่งไม่เหมือนกับอัลกอริธึมอื่นๆ ในรายการนี้ ใช้วิธีความน่าจะเป็น นี่หมายความว่าวิธีการนี้มีชุดของความน่าจะเป็นก่อนหน้าที่กำหนดไว้สำหรับการจัดประเภทแต่ละรายการสำหรับเป้าหมายของคุณ แทนที่จะกระโดดเข้าไปในข้อมูลโดยตรง อัลกอริทึมจะเปลี่ยนความน่าจะเป็นก่อนหน้าเหล่านี้เพื่อสร้างความน่าจะเป็นภายหลังเมื่อคุณป้อนข้อมูล ด้วยเหตุนี้ สิ่งนี้จึงมีประโยชน์อย่างเหลือเชื่อในสถานการณ์ที่คุณต้องการคาดการณ์ว่าข้อมูลที่ป้อนเข้าของคุณสอดคล้องกับหนึ่งใน n คลาสหรือไม่มีเลย สิ่งนี้สามารถทำได้โดยใช้เทคนิคความน่าจะเป็นเพราะความน่าจะเป็นที่โยนสำหรับ n คลาสทั้งหมดจะค่อนข้างต่ำ

ต้นไม้ตัดสินใจคืออะไร?

Decision Tree เป็นเพียงโครงสร้างแบบแผนผังลำดับงาน ซึ่งแต่ละโหนดภายนอกแสดงถึงการทดลองใช้แอตทริบิวต์ และแต่ละสาขาจะระบุผลลัพธ์ของการทดสอบ ป้ายชื่อที่คาดไว้จะถูกเก็บไว้ในโหนดปลายสุด เราเริ่มต้นที่รากของต้นไม้และไปที่โหนดปลายสุดโดยการเปรียบเทียบค่าแอตทริบิวต์ เมื่อต้องจัดการกับข้อมูลที่มีมิติสูงและใช้เวลาเพียงเล็กน้อยในการเตรียมข้อมูล เราใช้ตัวแยกประเภทนี้ อย่างไรก็ตาม คำเตือน: พวกเขามีแนวโน้มที่จะใส่มากเกินไปและสามารถเปลี่ยนแปลงได้อย่างมากแม้มีการเปลี่ยนแปลงเล็กน้อยในข้อมูลการฝึก

เครื่องสนับสนุนเวกเตอร์คืออะไร?

ในขอบเขตที่พยายามจัดเรียงจุดข้อมูลด้วยระยะขอบระหว่างสองคลาสให้กว้างที่สุดเท่าที่จะเป็นไปได้ SVM จะไม่ซ้ำกัน นี่เรียกว่าการแยกระยะขอบสูงสุด ประเด็นที่ควรทราบอีกประการหนึ่งคือ SVM ต่างจากการถดถอยเชิงเส้นตรงที่ SVM จะพล็อตไฮเปอร์เพลนโดยใช้เวกเตอร์สนับสนุนเท่านั้น ในขณะที่การถดถอยเชิงเส้นใช้ชุดข้อมูลทั้งหมด SVM มีประโยชน์อย่างยิ่งในสถานการณ์ที่ข้อมูลมีหลายมิติ ดังนั้น คุณจึงเริ่มต้นด้วยการสร้างไฮเปอร์เพลนแบบสุ่ม จากนั้นจึงวัดระยะห่างระหว่างมันกับค่าข้อมูลที่ใกล้เคียงที่สุดจากแต่ละคลาส เวกเตอร์สนับสนุนเป็นจุดข้อมูลที่ใกล้กับไฮเปอร์เพลนมากที่สุด