โครงสร้างการตัดสินใจในการเรียนรู้ของเครื่องอธิบาย [พร้อมตัวอย่าง]

เผยแพร่แล้ว: 2020-12-21

บทนำ

Decision Tree Learning เป็นเทคนิคการทำเหมืองข้อมูลกระแสหลักและเป็นรูปแบบของการเรียนรู้ของเครื่องภายใต้การดูแล โครงสร้างการตัดสินใจเปรียบเสมือนแผนภาพที่ผู้คนใช้แทนความน่าจะเป็นทางสถิติหรือค้นหาวิถีที่กำลังเกิดขึ้น การกระทำ หรือผลลัพธ์ ตัวอย่างแผนผังการตัดสินใจทำให้เข้าใจแนวคิดได้ชัดเจนขึ้น

กิ่งก้านในไดอะแกรมของโครงสร้างการตัดสินใจแสดงผลลัพธ์ที่เป็นไปได้ การตัดสินใจที่เป็นไปได้ หรือปฏิกิริยาตอบสนอง สาขาที่ส่วนท้ายของโครงสร้างการตัดสินใจจะแสดงการทำนายหรือผลลัพธ์ แผนภูมิการตัดสินใจมักใช้เพื่อค้นหาวิธีแก้ไขปัญหาที่มีความซับซ้อนในการแก้ไขด้วยตนเอง ให้เราเข้าใจรายละเอียดนี้ด้วยความช่วยเหลือของตัวอย่างแผนภูมิการตัดสินใจบางส่วน

โครงสร้างการตัดสินใจเป็นหนึ่งในเครื่องมือที่ได้รับความนิยมและทรงพลังซึ่งใช้สำหรับทำนายและจำแนกข้อมูลหรือเหตุการณ์ เป็นเหมือนผังงาน แต่มีโครงสร้างเป็นต้นไม้ โหนดภายในของต้นไม้แสดงถึงการทดสอบหรือคำถามเกี่ยวกับแอตทริบิวต์ แต่ละสาขาเป็นผลที่เป็นไปได้ของคำถามที่ถาม และโหนดปลายทาง ซึ่งเรียกอีกอย่างว่าโหนดปลายสุด แสดงถึงป้ายชื่อคลาส

ในแผนผังการตัดสินใจ เรามีตัวแปรทำนายหลายตัว ขึ้นอยู่กับตัวแปรทำนายเหล่านี้ พยายามทำนายตัวแปรตอบสนองที่เรียกว่า

การอ่านที่เกี่ยวข้อง: การจำแนกต้นไม้การตัดสินใจ: ทุกสิ่งที่คุณจำเป็นต้องรู้

โครงสร้างการตัดสินใจใน ML

ด้วยการแสดงสองสามขั้นตอนในรูปแบบของลำดับ ต้นไม้การตัดสินใจจะกลายเป็นวิธีที่ง่ายและมีประสิทธิภาพในการทำความเข้าใจและเห็นภาพตัวเลือกการตัดสินใจที่เป็นไปได้และผลลัพธ์ที่เป็นไปได้จากช่วง โครงสร้างการตัดสินใจยังมีประโยชน์ในการระบุตัวเลือกที่เป็นไปได้และการชั่งน้ำหนักรางวัลและความเสี่ยงกับแต่ละแนวทางปฏิบัติที่สามารถให้ได้

โครงสร้างการตัดสินใจถูกนำไปใช้ในองค์กรขนาดเล็กและขนาดใหญ่จำนวนมาก เป็นระบบสนับสนุนในการตัดสินใจ เนื่องจากตัวอย่าง แผนผังการตัดสินใจ เป็นรูปแบบที่มีโครงสร้าง ผู้อ่านสามารถเข้าใจแผนภูมิและวิเคราะห์ว่าตัวเลือกใดตัวเลือกหนึ่งอาจนำไปสู่การตัดสินใจที่สอดคล้องกันได้อย่างไรและเพราะเหตุใด ตัวอย่างแผนผัง การ ตัดสินใจ ยังช่วยให้ผู้อ่านคาดการณ์และรับวิธีแก้ปัญหาที่เป็นไปได้หลายอย่างสำหรับปัญหาเดียว ทำความเข้าใจรูปแบบ และความสัมพันธ์ระหว่างเหตุการณ์และข้อมูลต่างๆ กับการตัดสินใจ

ผลลัพธ์แต่ละรายการในแผนภูมิมีรางวัลและหมายเลขความเสี่ยงหรือน้ำหนักที่กำหนด หากคุณเคยใช้โครงสร้างการตัดสินใจ คุณจะมีผลลัพธ์สุดท้ายพร้อมทั้งข้อเสียและผลประโยชน์ที่เป็นไปได้ ในการสรุปแผนผังของคุณอย่างเหมาะสม คุณสามารถขยายแผนผังให้สั้นหรือยาวได้ตามต้องการ ทั้งนี้ขึ้นอยู่กับเหตุการณ์และปริมาณข้อมูล ให้เรา ยกตัวอย่างโครงสร้างการตัดสินใจ ง่ายๆ เพื่อทำความเข้าใจให้ดีขึ้น

พิจารณาข้อมูลที่ให้มาซึ่งประกอบด้วยรายละเอียดของคนที่ชอบ ไม่ว่าจะเป็นนักดื่ม ผู้สูบบุหรี่ น้ำหนักตัว และอายุที่คนเหล่านี้เสียชีวิต

ชื่อ นักดื่ม นักสูบบุหรี่ น้ำหนัก อายุ (เสียชีวิต)
แซม ใช่ ใช่ 120 44
แมรี่ ไม่ ไม่ 70 96
โจนัส ใช่ ไม่ 72 88
เทย์เลอร์ ใช่ ใช่ 55 52
โจ ไม่ ใช่ 94 56
แฮร์รี่ ไม่ ไม่ 62 93

ให้เราลองทำนายว่าคนจะตายตั้งแต่อายุยังน้อยหรืออายุมาก ลักษณะนิสัยชอบดื่มสุรา คนสูบบุหรี่ และน้ำหนักตัวจะทำหน้าที่เป็นตัวทำนายค่า เมื่อใช้สิ่งเหล่านี้ เราจะพิจารณาอายุเป็นตัวแปรการตอบสนอง

ให้เราติดป้ายว่าคนที่เสียชีวิตก่อนอายุ 70 ​​ปีเสียชีวิต "เด็ก" และคนที่เสียชีวิตหลังจากอายุ 70 ​​ปีเสียชีวิต "แก่" ให้เราทำนายตัวแปรการตอบสนองตามตัวแปรตัวทำนาย รับด้านล่างเป็นแผนผังการตัดสินใจหลังจากเรียนรู้ข้อมูล

ต้นไม้การตัดสินใจด้านบนอธิบายว่าถ้าคนสูบบุหรี่พวกเขาจะตายตั้งแต่ยังเด็ก หากบุคคลนั้นไม่สูบบุหรี่ ปัจจัยต่อไปที่พิจารณาก็คือว่าบุคคลนั้นเป็นนักดื่มหรือไม่ หากบุคคลนั้นไม่สูบบุหรี่และไม่ได้ดื่มสุรา บุคคลนั้นถึงแก่ความตาย

หากบุคคลไม่สูบบุหรี่และดื่มสุรา ให้พิจารณาน้ำหนักของบุคคลนั้น หากบุคคลไม่สูบบุหรี่ ดื่มสุรา และมีน้ำหนักต่ำกว่า 90 กก. บุคคลนั้นถึงแก่ความตาย และสุดท้าย ถ้าคนไม่สูบบุหรี่ ดื่มสุรา และมีน้ำหนักเกิน 90 กก. พวกเขาก็ตายตั้งแต่ยังเด็ก

จากข้อมูลที่ให้มา มาดูตัวอย่างของ Jonas เพื่อตรวจสอบว่าแผนผังการตัดสินใจจัดประเภทถูกต้องหรือไม่ และทำนายตัวแปรตอบสนองได้ถูกต้องหรือไม่ โยนาสไม่สูบบุหรี่ เป็นนักดื่ม และมีน้ำหนักไม่เกิน 90 กก. ตามแผนภูมิต้นไม้แห่งการตัดสินใจ เขาจะตายอย่างชรา (อายุที่เขาตาย>70) นอกจากนี้ ตามข้อมูล เขาเสียชีวิตเมื่ออายุ 88 ปี นี่หมายความว่า ตัวอย่างแผนผังการตัดสินใจ ได้รับการจัดประเภทอย่างถูกต้องและทำงานได้อย่างสมบูรณ์

แต่คุณเคยสงสัยเกี่ยวกับแนวคิดพื้นฐานเบื้องหลังการทำงานของโครงสร้างการตัดสินใจหรือไม่? ในแผนผังการตัดสินใจ ชุดของอินสแตนซ์จะถูกแบ่งออกเป็นชุดย่อยในลักษณะที่รูปแบบในแต่ละชุดย่อยมีขนาดเล็กลง นั่นคือ เราต้องการลดเอนโทรปี และด้วยเหตุนี้ การแปรผันจึงลดลง และเหตุการณ์หรืออินสแตนซ์พยายามทำให้บริสุทธิ์

ให้เราพิจารณาตัวอย่างแผนผัง การตัดสินใจ ที่คล้าย กัน ประการแรก เราพิจารณาว่าบุคคลนั้นสูบบุหรี่หรือไม่

ที่นี่เราไม่แน่ใจเกี่ยวกับผู้ไม่สูบบุหรี่ ดังนั้นเราจึงแบ่งออกเป็นผู้ดื่มและไม่ดื่ม

เราสามารถเห็นได้จากไดอะแกรมด้านล่างว่าเราเปลี่ยนจากเอนโทรปีสูงที่มีความผันแปรมากเพื่อลดระดับลงเป็นคลาสที่เล็กกว่าซึ่งเรามั่นใจมากขึ้น ด้วยวิธีนี้ คุณสามารถสร้าง ตัวอย่างแผนผังการตัดสินใจ ได้ทีละ น้อย

ให้เราสร้างแผนผังการตัดสินใจโดยใช้อัลกอริทึม ID3 สิ่งที่สำคัญกว่าในแผนผังการตัดสินใจคือความเข้าใจอย่างถ่องแท้เกี่ยวกับเอนโทรปี เอนโทรปีเป็นเพียงระดับของความไม่แน่นอน มอบให้โดย:

(บางครั้งก็ใช้ตัว “E”) แทน

ถ้าเรานำไปใช้กับตัวอย่างข้างต้น มันจะเป็นดังนี้:

พิจารณากรณีที่เราไม่ได้แยกบุคคลออกเป็นหมวดหมู่ใดๆ เป็นกรณีที่เลวร้ายที่สุด (เอนโทรปีสูง) เมื่อคนทั้งสองประเภทมีจำนวนเท่ากัน อัตราส่วนนี้คือ 3:3

ในทำนองเดียวกันสำหรับผู้ที่ไม่ดื่มมีอัตราส่วน 1:1 และเอนโทรปีจะเป็น 1 ดังนั้นจึงจำเป็นต้องแยกส่วนเพิ่มเติมเนื่องจากความไม่แน่นอน สำหรับคนที่ไม่ดื่มจะมีอัตราส่วน 2:0 ดังนั้น เอนโทรปีจึงเป็น 0

ตอนนี้ เราได้คำนวณเอนโทรปีสำหรับกรณีต่างๆ แล้วด้วยเหตุนี้ เราจึงสามารถคำนวณค่าเฉลี่ยถ่วงน้ำหนักได้เช่นเดียวกัน

สำหรับสาขาแรก E= 6 6 1=1

สำหรับคลาส Smoker E= 2 6 0+ 4 6 0.811=0.54

สำหรับผู้สูบบุหรี่และนักดื่ม E= 2 6 0+ 2 6 1+ 2 6 0=0.33

แผนภาพด้านล่างจะช่วยให้คุณเข้าใจการคำนวณข้างต้นได้อย่างรวดเร็ว

ในที่สุด ข้อมูลที่ได้รับ:

ระดับ เอนโทรปี ข้อมูลที่ได้รับ (E2-E1)
ประชากร 1 0.46
นักสูบบุหรี่ 0.54 0.21
นักสูบบุหรี่+นักดื่ม 0.33

อ่านเพิ่มเติม: คำถามและคำตอบในการสัมภาษณ์ต้นไม้ตัดสินใจ

บทสรุป

เราประสบความสำเร็จในการศึกษาแผนผังการตัดสินใจในเชิงลึกตั้งแต่ทฤษฎีไปจนถึงตัวอย่าง แผนผังการตัดสินใจ เชิงปฏิบัติ e เรายังสร้างแผนผังการตัดสินใจโดยใช้อัลกอริธึม ID3 หากคุณพบว่าสิ่งนี้น่าสนใจ คุณอาจชอบที่จะสำรวจวิทยาศาสตร์ข้อมูลโดยละเอียด

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับแผนผังการตัดสินใจ แมชชีนเลิร์นนิง โปรดดูที่ IIIT-B & upGrad's PG Diploma in Machine Learning & AI ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมอย่างเข้มงวดมากกว่า 450 ชั่วโมง กรณีศึกษาและการมอบหมายมากกว่า 30 รายการ , สถานะศิษย์เก่า IIIT-B, 5+ โครงการหลักที่ใช้งานได้จริง & ความช่วยเหลือด้านงานกับบริษัทชั้นนำ

ต้นไม้ตัดสินใจคืออะไร?

ต้นไม้การตัดสินใจใช้เพื่อจัดระเบียบและจัดระเบียบข้อมูลการตัดสินใจด้วยสายตา ต้นไม้ถูกวาดโดยให้รากอยู่ด้านบนและใบอยู่ด้านล่าง แผนผังการตัดสินใจจะอ่านจากล่างขึ้นบน เลื่อนจากซ้ายไปขวา ต้นไม้แต่ละระดับเป็นฐานสำหรับการทดสอบเพิ่มเติม และการตัดสินใจในแต่ละระดับจะจำกัดขอบเขตให้แคบลงจนกว่าจะตอบคำถาม โครงสร้างการตัดสินใจแบ่งปัญหาหรือการตัดสินใจออกเป็นการตัดสินใจย่อยหลายๆ ครั้ง และเดินตามเส้นทางตรรกะไปยังราก ซึ่งเป็นเป้าหมายหลัก แผนผังการตัดสินใจใช้ในการวิเคราะห์สภาพแวดล้อมทางธุรกิจ จัดลำดับความสำคัญ และให้ข้อมูลเชิงลึก เพื่อตัดสินใจว่าจะต้องดำเนินการไปในทิศทางใด

อะไรคือปัญหาในการเรียนรู้แผนผังการตัดสินใจในการเรียนรู้ของเครื่อง

ต้นไม้การตัดสินใจสามารถใช้เป็นพื้นฐานในการทดสอบกลยุทธ์ใหม่หรือเพื่ออธิบายกลยุทธ์ให้ผู้อื่นทราบ โครงสร้างการตัดสินใจอธิบายว่าจะเกิดอะไรขึ้นภายใต้ชุดสมมติฐานที่กำหนด นอกจากนี้ยังใช้เพื่อประเมินประสิทธิภาพของกลยุทธ์ที่เคยใช้ในอดีตได้อีกด้วย เป็นที่ทราบกันดีว่าต้นไม้แห่งการตัดสินใจนั้นอ่อนไหวต่อข้อผิดพลาดมากเกินไปเพราะกิ่งก้านของมันทั้งหมด โครงสร้างการตัดสินใจไม่ได้แม่นยำเสมอไป เพราะในบางครั้ง โครงสร้างการตัดสินใจไม่ได้คำนึงถึงตัวแปรที่เป็นไปได้ทั้งหมด และบุคคลที่วิเคราะห์แผนภูมิการตัดสินใจอาจไม่ได้มีประสบการณ์ในทุกแง่มุมของสถานการณ์นั้นๆ

ข้อมูลประเภทใดดีที่สุดสำหรับแผนผังการตัดสินใจ

Decision Trees ช่วยคุณค้นหารูปแบบในข้อมูลโดยใช้แผนผังลำดับงาน เช่น โครงสร้าง ประเภทของข้อมูลที่ดีที่สุดคือเชิงคุณภาพ เชิงหมวดหมู่ และเชิงตัวเลข แม้ว่าแผนผังการตัดสินใจจะทำงานกับข้อมูลทุกประเภท แต่จะทำงานได้ดีที่สุดกับข้อมูลตัวเลข พวกเขาจะต้องสามารถมีค่าที่เป็นตัวเลขหรือควรจะมีวิธีการแปลเป็นตัวเลข โครงสร้างการตัดสินใจขึ้นอยู่กับประเภทของข้อมูลและปริมาณเป็นอย่างมาก หากจำนวนจุดข้อมูลมากกว่า 100 Decision Trees จะเป็นแบบอย่างที่ดี