โครงสร้างการตัดสินใจในการเรียนรู้ของเครื่องอธิบาย [พร้อมตัวอย่าง]
เผยแพร่แล้ว: 2020-12-21บทนำ
Decision Tree Learning เป็นเทคนิคการทำเหมืองข้อมูลกระแสหลักและเป็นรูปแบบของการเรียนรู้ของเครื่องภายใต้การดูแล โครงสร้างการตัดสินใจเปรียบเสมือนแผนภาพที่ผู้คนใช้แทนความน่าจะเป็นทางสถิติหรือค้นหาวิถีที่กำลังเกิดขึ้น การกระทำ หรือผลลัพธ์ ตัวอย่างแผนผังการตัดสินใจทำให้เข้าใจแนวคิดได้ชัดเจนขึ้น
กิ่งก้านในไดอะแกรมของโครงสร้างการตัดสินใจแสดงผลลัพธ์ที่เป็นไปได้ การตัดสินใจที่เป็นไปได้ หรือปฏิกิริยาตอบสนอง สาขาที่ส่วนท้ายของโครงสร้างการตัดสินใจจะแสดงการทำนายหรือผลลัพธ์ แผนภูมิการตัดสินใจมักใช้เพื่อค้นหาวิธีแก้ไขปัญหาที่มีความซับซ้อนในการแก้ไขด้วยตนเอง ให้เราเข้าใจรายละเอียดนี้ด้วยความช่วยเหลือของตัวอย่างแผนภูมิการตัดสินใจบางส่วน
โครงสร้างการตัดสินใจเป็นหนึ่งในเครื่องมือที่ได้รับความนิยมและทรงพลังซึ่งใช้สำหรับทำนายและจำแนกข้อมูลหรือเหตุการณ์ เป็นเหมือนผังงาน แต่มีโครงสร้างเป็นต้นไม้ โหนดภายในของต้นไม้แสดงถึงการทดสอบหรือคำถามเกี่ยวกับแอตทริบิวต์ แต่ละสาขาเป็นผลที่เป็นไปได้ของคำถามที่ถาม และโหนดปลายทาง ซึ่งเรียกอีกอย่างว่าโหนดปลายสุด แสดงถึงป้ายชื่อคลาส
ในแผนผังการตัดสินใจ เรามีตัวแปรทำนายหลายตัว ขึ้นอยู่กับตัวแปรทำนายเหล่านี้ พยายามทำนายตัวแปรตอบสนองที่เรียกว่า
การอ่านที่เกี่ยวข้อง: การจำแนกต้นไม้การตัดสินใจ: ทุกสิ่งที่คุณจำเป็นต้องรู้
โครงสร้างการตัดสินใจใน ML
ด้วยการแสดงสองสามขั้นตอนในรูปแบบของลำดับ ต้นไม้การตัดสินใจจะกลายเป็นวิธีที่ง่ายและมีประสิทธิภาพในการทำความเข้าใจและเห็นภาพตัวเลือกการตัดสินใจที่เป็นไปได้และผลลัพธ์ที่เป็นไปได้จากช่วง โครงสร้างการตัดสินใจยังมีประโยชน์ในการระบุตัวเลือกที่เป็นไปได้และการชั่งน้ำหนักรางวัลและความเสี่ยงกับแต่ละแนวทางปฏิบัติที่สามารถให้ได้

โครงสร้างการตัดสินใจถูกนำไปใช้ในองค์กรขนาดเล็กและขนาดใหญ่จำนวนมาก เป็นระบบสนับสนุนในการตัดสินใจ เนื่องจากตัวอย่าง แผนผังการตัดสินใจ เป็นรูปแบบที่มีโครงสร้าง ผู้อ่านสามารถเข้าใจแผนภูมิและวิเคราะห์ว่าตัวเลือกใดตัวเลือกหนึ่งอาจนำไปสู่การตัดสินใจที่สอดคล้องกันได้อย่างไรและเพราะเหตุใด ตัวอย่างแผนผัง การ ตัดสินใจ ยังช่วยให้ผู้อ่านคาดการณ์และรับวิธีแก้ปัญหาที่เป็นไปได้หลายอย่างสำหรับปัญหาเดียว ทำความเข้าใจรูปแบบ และความสัมพันธ์ระหว่างเหตุการณ์และข้อมูลต่างๆ กับการตัดสินใจ
ผลลัพธ์แต่ละรายการในแผนภูมิมีรางวัลและหมายเลขความเสี่ยงหรือน้ำหนักที่กำหนด หากคุณเคยใช้โครงสร้างการตัดสินใจ คุณจะมีผลลัพธ์สุดท้ายพร้อมทั้งข้อเสียและผลประโยชน์ที่เป็นไปได้ ในการสรุปแผนผังของคุณอย่างเหมาะสม คุณสามารถขยายแผนผังให้สั้นหรือยาวได้ตามต้องการ ทั้งนี้ขึ้นอยู่กับเหตุการณ์และปริมาณข้อมูล ให้เรา ยกตัวอย่างโครงสร้างการตัดสินใจ ง่ายๆ เพื่อทำความเข้าใจให้ดีขึ้น
พิจารณาข้อมูลที่ให้มาซึ่งประกอบด้วยรายละเอียดของคนที่ชอบ ไม่ว่าจะเป็นนักดื่ม ผู้สูบบุหรี่ น้ำหนักตัว และอายุที่คนเหล่านี้เสียชีวิต
ชื่อ | นักดื่ม | นักสูบบุหรี่ | น้ำหนัก | อายุ (เสียชีวิต) |
แซม | ใช่ | ใช่ | 120 | 44 |
แมรี่ | ไม่ | ไม่ | 70 | 96 |
โจนัส | ใช่ | ไม่ | 72 | 88 |
เทย์เลอร์ | ใช่ | ใช่ | 55 | 52 |
โจ | ไม่ | ใช่ | 94 | 56 |
แฮร์รี่ | ไม่ | ไม่ | 62 | 93 |
ให้เราลองทำนายว่าคนจะตายตั้งแต่อายุยังน้อยหรืออายุมาก ลักษณะนิสัยชอบดื่มสุรา คนสูบบุหรี่ และน้ำหนักตัวจะทำหน้าที่เป็นตัวทำนายค่า เมื่อใช้สิ่งเหล่านี้ เราจะพิจารณาอายุเป็นตัวแปรการตอบสนอง
ให้เราติดป้ายว่าคนที่เสียชีวิตก่อนอายุ 70 ปีเสียชีวิต "เด็ก" และคนที่เสียชีวิตหลังจากอายุ 70 ปีเสียชีวิต "แก่" ให้เราทำนายตัวแปรการตอบสนองตามตัวแปรตัวทำนาย รับด้านล่างเป็นแผนผังการตัดสินใจหลังจากเรียนรู้ข้อมูล
ต้นไม้การตัดสินใจด้านบนอธิบายว่าถ้าคนสูบบุหรี่พวกเขาจะตายตั้งแต่ยังเด็ก หากบุคคลนั้นไม่สูบบุหรี่ ปัจจัยต่อไปที่พิจารณาก็คือว่าบุคคลนั้นเป็นนักดื่มหรือไม่ หากบุคคลนั้นไม่สูบบุหรี่และไม่ได้ดื่มสุรา บุคคลนั้นถึงแก่ความตาย
หากบุคคลไม่สูบบุหรี่และดื่มสุรา ให้พิจารณาน้ำหนักของบุคคลนั้น หากบุคคลไม่สูบบุหรี่ ดื่มสุรา และมีน้ำหนักต่ำกว่า 90 กก. บุคคลนั้นถึงแก่ความตาย และสุดท้าย ถ้าคนไม่สูบบุหรี่ ดื่มสุรา และมีน้ำหนักเกิน 90 กก. พวกเขาก็ตายตั้งแต่ยังเด็ก
จากข้อมูลที่ให้มา มาดูตัวอย่างของ Jonas เพื่อตรวจสอบว่าแผนผังการตัดสินใจจัดประเภทถูกต้องหรือไม่ และทำนายตัวแปรตอบสนองได้ถูกต้องหรือไม่ โยนาสไม่สูบบุหรี่ เป็นนักดื่ม และมีน้ำหนักไม่เกิน 90 กก. ตามแผนภูมิต้นไม้แห่งการตัดสินใจ เขาจะตายอย่างชรา (อายุที่เขาตาย>70) นอกจากนี้ ตามข้อมูล เขาเสียชีวิตเมื่ออายุ 88 ปี นี่หมายความว่า ตัวอย่างแผนผังการตัดสินใจ ได้รับการจัดประเภทอย่างถูกต้องและทำงานได้อย่างสมบูรณ์
แต่คุณเคยสงสัยเกี่ยวกับแนวคิดพื้นฐานเบื้องหลังการทำงานของโครงสร้างการตัดสินใจหรือไม่? ในแผนผังการตัดสินใจ ชุดของอินสแตนซ์จะถูกแบ่งออกเป็นชุดย่อยในลักษณะที่รูปแบบในแต่ละชุดย่อยมีขนาดเล็กลง นั่นคือ เราต้องการลดเอนโทรปี และด้วยเหตุนี้ การแปรผันจึงลดลง และเหตุการณ์หรืออินสแตนซ์พยายามทำให้บริสุทธิ์

ให้เราพิจารณาตัวอย่างแผนผัง การตัดสินใจ ที่คล้าย กัน ประการแรก เราพิจารณาว่าบุคคลนั้นสูบบุหรี่หรือไม่
ที่นี่เราไม่แน่ใจเกี่ยวกับผู้ไม่สูบบุหรี่ ดังนั้นเราจึงแบ่งออกเป็นผู้ดื่มและไม่ดื่ม
เราสามารถเห็นได้จากไดอะแกรมด้านล่างว่าเราเปลี่ยนจากเอนโทรปีสูงที่มีความผันแปรมากเพื่อลดระดับลงเป็นคลาสที่เล็กกว่าซึ่งเรามั่นใจมากขึ้น ด้วยวิธีนี้ คุณสามารถสร้าง ตัวอย่างแผนผังการตัดสินใจ ได้ทีละ น้อย
ให้เราสร้างแผนผังการตัดสินใจโดยใช้อัลกอริทึม ID3 สิ่งที่สำคัญกว่าในแผนผังการตัดสินใจคือความเข้าใจอย่างถ่องแท้เกี่ยวกับเอนโทรปี เอนโทรปีเป็นเพียงระดับของความไม่แน่นอน มอบให้โดย:
(บางครั้งก็ใช้ตัว “E”) แทน
ถ้าเรานำไปใช้กับตัวอย่างข้างต้น มันจะเป็นดังนี้:
พิจารณากรณีที่เราไม่ได้แยกบุคคลออกเป็นหมวดหมู่ใดๆ เป็นกรณีที่เลวร้ายที่สุด (เอนโทรปีสูง) เมื่อคนทั้งสองประเภทมีจำนวนเท่ากัน อัตราส่วนนี้คือ 3:3
ในทำนองเดียวกันสำหรับผู้ที่ไม่ดื่มมีอัตราส่วน 1:1 และเอนโทรปีจะเป็น 1 ดังนั้นจึงจำเป็นต้องแยกส่วนเพิ่มเติมเนื่องจากความไม่แน่นอน สำหรับคนที่ไม่ดื่มจะมีอัตราส่วน 2:0 ดังนั้น เอนโทรปีจึงเป็น 0
ตอนนี้ เราได้คำนวณเอนโทรปีสำหรับกรณีต่างๆ แล้วด้วยเหตุนี้ เราจึงสามารถคำนวณค่าเฉลี่ยถ่วงน้ำหนักได้เช่นเดียวกัน
สำหรับสาขาแรก E= 6 6 1=1
สำหรับคลาส Smoker E= 2 6 0+ 4 6 0.811=0.54
สำหรับผู้สูบบุหรี่และนักดื่ม E= 2 6 0+ 2 6 1+ 2 6 0=0.33

แผนภาพด้านล่างจะช่วยให้คุณเข้าใจการคำนวณข้างต้นได้อย่างรวดเร็ว
ในที่สุด ข้อมูลที่ได้รับ:
ระดับ | เอนโทรปี | ข้อมูลที่ได้รับ (E2-E1) |
ประชากร | 1 | 0.46 |
นักสูบบุหรี่ | 0.54 | 0.21 |
นักสูบบุหรี่+นักดื่ม | 0.33 | – |
อ่านเพิ่มเติม: คำถามและคำตอบในการสัมภาษณ์ต้นไม้ตัดสินใจ
บทสรุป
เราประสบความสำเร็จในการศึกษาแผนผังการตัดสินใจในเชิงลึกตั้งแต่ทฤษฎีไปจนถึงตัวอย่าง แผนผังการตัดสินใจ เชิงปฏิบัติ e เรายังสร้างแผนผังการตัดสินใจโดยใช้อัลกอริธึม ID3 หากคุณพบว่าสิ่งนี้น่าสนใจ คุณอาจชอบที่จะสำรวจวิทยาศาสตร์ข้อมูลโดยละเอียด
หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับแผนผังการตัดสินใจ แมชชีนเลิร์นนิง โปรดดูที่ IIIT-B & upGrad's PG Diploma in Machine Learning & AI ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมอย่างเข้มงวดมากกว่า 450 ชั่วโมง กรณีศึกษาและการมอบหมายมากกว่า 30 รายการ , สถานะศิษย์เก่า IIIT-B, 5+ โครงการหลักที่ใช้งานได้จริง & ความช่วยเหลือด้านงานกับบริษัทชั้นนำ
ต้นไม้ตัดสินใจคืออะไร?
ต้นไม้การตัดสินใจใช้เพื่อจัดระเบียบและจัดระเบียบข้อมูลการตัดสินใจด้วยสายตา ต้นไม้ถูกวาดโดยให้รากอยู่ด้านบนและใบอยู่ด้านล่าง แผนผังการตัดสินใจจะอ่านจากล่างขึ้นบน เลื่อนจากซ้ายไปขวา ต้นไม้แต่ละระดับเป็นฐานสำหรับการทดสอบเพิ่มเติม และการตัดสินใจในแต่ละระดับจะจำกัดขอบเขตให้แคบลงจนกว่าจะตอบคำถาม โครงสร้างการตัดสินใจแบ่งปัญหาหรือการตัดสินใจออกเป็นการตัดสินใจย่อยหลายๆ ครั้ง และเดินตามเส้นทางตรรกะไปยังราก ซึ่งเป็นเป้าหมายหลัก แผนผังการตัดสินใจใช้ในการวิเคราะห์สภาพแวดล้อมทางธุรกิจ จัดลำดับความสำคัญ และให้ข้อมูลเชิงลึก เพื่อตัดสินใจว่าจะต้องดำเนินการไปในทิศทางใด
อะไรคือปัญหาในการเรียนรู้แผนผังการตัดสินใจในการเรียนรู้ของเครื่อง
ต้นไม้การตัดสินใจสามารถใช้เป็นพื้นฐานในการทดสอบกลยุทธ์ใหม่หรือเพื่ออธิบายกลยุทธ์ให้ผู้อื่นทราบ โครงสร้างการตัดสินใจอธิบายว่าจะเกิดอะไรขึ้นภายใต้ชุดสมมติฐานที่กำหนด นอกจากนี้ยังใช้เพื่อประเมินประสิทธิภาพของกลยุทธ์ที่เคยใช้ในอดีตได้อีกด้วย เป็นที่ทราบกันดีว่าต้นไม้แห่งการตัดสินใจนั้นอ่อนไหวต่อข้อผิดพลาดมากเกินไปเพราะกิ่งก้านของมันทั้งหมด โครงสร้างการตัดสินใจไม่ได้แม่นยำเสมอไป เพราะในบางครั้ง โครงสร้างการตัดสินใจไม่ได้คำนึงถึงตัวแปรที่เป็นไปได้ทั้งหมด และบุคคลที่วิเคราะห์แผนภูมิการตัดสินใจอาจไม่ได้มีประสบการณ์ในทุกแง่มุมของสถานการณ์นั้นๆ
ข้อมูลประเภทใดดีที่สุดสำหรับแผนผังการตัดสินใจ
Decision Trees ช่วยคุณค้นหารูปแบบในข้อมูลโดยใช้แผนผังลำดับงาน เช่น โครงสร้าง ประเภทของข้อมูลที่ดีที่สุดคือเชิงคุณภาพ เชิงหมวดหมู่ และเชิงตัวเลข แม้ว่าแผนผังการตัดสินใจจะทำงานกับข้อมูลทุกประเภท แต่จะทำงานได้ดีที่สุดกับข้อมูลตัวเลข พวกเขาจะต้องสามารถมีค่าที่เป็นตัวเลขหรือควรจะมีวิธีการแปลเป็นตัวเลข โครงสร้างการตัดสินใจขึ้นอยู่กับประเภทของข้อมูลและปริมาณเป็นอย่างมาก หากจำนวนจุดข้อมูลมากกว่า 100 Decision Trees จะเป็นแบบอย่างที่ดี