คำถามและคำตอบในการสัมภาษณ์ต้นไม้ตัดสินใจ [สำหรับผู้เริ่มต้นและผู้มีประสบการณ์]

เผยแพร่แล้ว: 2020-09-22

ในโลกของการเรียนรู้ของเครื่อง แผนผังการตัดสินใจเป็นหนึ่งในนั้น ถ้าไม่ใช่อัลกอริธึมที่น่านับถือที่สุด ต้นไม้แห่งการตัดสินใจก็ทรงพลังเช่นกัน แผนผังการตัดสินใจใช้เพื่อทำนายค่าต่อเนื่อง (การถดถอย) หรือทำนายคลาส (ดำเนินการจำแนกหรือจัดประเภท) ของอินสแตนซ์ที่จัดเตรียมให้กับอัลกอริทึม

ต้นไม้ตัดสินใจคล้ายกับแผนผังลำดับงานในโครงสร้าง โหนดของแผนผังการตัดสินใจใดๆ แสดงถึงการทดสอบที่ทำกับแอตทริบิวต์ แต่ละสาขาของแผนผังการตัดสินใจเป็นตัวแทนของผลการตรวจสอบที่ดำเนินการในแต่ละโหนด โหนดของลีฟทุกอัน (ซึ่งเรียกอีกอย่างว่าโหนดเทอร์มินัล) มีป้ายกำกับของคลาส

นั่นคือโครงสร้างของต้นไม้ อย่างไรก็ตาม ความนิยมที่เพิ่มขึ้นของต้นไม้ตัดสินใจไม่ได้เกิดจากวิธีการสร้าง ความโปร่งใสของต้นไม้ทำให้ต้นไม้มีสถานะเป็นของตัวเองในโลกที่มีอัลกอริธึมที่ทรงพลังและมีประโยชน์ จริงๆ แล้ว คุณสามารถทำทุกอย่างด้วยมือสำหรับแผนผังการตัดสินใจขนาดเล็ก และคุณสามารถคาดการณ์ได้ว่าแผนผังการตัดสินใจจะเกิดขึ้นได้อย่างไร สำหรับต้นไม้ที่มีขนาดใหญ่ขึ้น การออกกำลังกายนี้ค่อนข้างจะน่าเบื่อ

อย่างไรก็ตาม นั่นไม่ได้หมายความว่าคุณจะไม่สามารถเข้าใจว่าต้นไม้กำลังทำอะไรในแต่ละโหนด ความสามารถในการเข้าใจสิ่งที่เกิดขึ้นเบื้องหลังหรือภายใต้ประทุนนั้นสร้างความแตกต่างให้กับแผนผังการตัดสินใจกับอัลกอริธึมแมชชีนเลิร์นนิงอื่น ๆ

ดังที่เราได้เห็นแล้วว่าแผนผังการตัดสินใจมีความสำคัญเพียงใด ต้นไม้แห่งการตัดสินใจก็มีความสำคัญสำหรับมืออาชีพด้านแมชชีนเลิร์นนิงหรือนักวิทยาศาสตร์ด้านข้อมูลโดยธรรมชาติ เพื่อช่วยให้คุณเข้าใจแนวคิดนี้และในขณะเดียวกันก็ช่วยให้คุณได้รับ zing ที่พิเศษในการสัมภาษณ์ของคุณ เราได้จัดทำรายการคำถามและคำตอบในการสัมภาษณ์ต้นไม้การตัดสินใจและคำถามและคำตอบในการสัมภาษณ์ต้นไม้การตัดสินใจ คำถามเหล่านี้จะช่วยคุณในการสัมภาษณ์ พยายามแก้คำถามแต่ละข้อเหล่านี้ก่อนอ่านคำตอบเพื่อให้ได้ประโยชน์สูงสุดจากคำถามเหล่านี้

สารบัญ

คำถามและคำตอบในการสัมภาษณ์ต้นไม้ตัดสินใจ

ไตรมาสที่ 1 คุณจะเห็นข้อความแจ้งสองรายการด้านล่าง คุณจะต้องอ่านทั้งสองอย่างอย่างรอบคอบแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกของทั้งสองคำสั่ง คำถามตามบริบทคือ เลือกข้อความที่เป็นจริงเกี่ยวกับการตัดต้นไม้

ต้นไม้แต่ละต้นไม่ได้ขึ้นอยู่กับต้นไม้อื่นเลย
เพื่อปรับปรุงประสิทธิภาพโดยรวมของแบบจำลอง การรวมจะนำมาจากผู้เรียนที่อ่อนแอ วิธีนี้เรียกว่าการห่อต้นไม้
เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
ทั้งข้อความที่หนึ่งและสองเป็นความจริง
ไม่มีตัวเลือกใดที่กล่าวถึงข้างต้น

ตอบ คำตอบที่ถูกต้องสำหรับคำถามนี้คือ C เพราะสำหรับต้นไม้บรรจุถุง ข้อความทั้งสองนี้เป็นความจริง ในการแพ็คต้นไม้หรือการรวมบูตสแตรป เป้าหมายหลักของการใช้อัลกอริธึมนี้คือการลดปริมาณของความแปรปรวนที่มีอยู่ในแผนผังการตัดสินใจ กลไกของการสร้างแผนผังการบรรจุถุงคือการแทนที่ ชุดย่อยจำนวนหนึ่งจะนำมาจากตัวอย่างที่มีอยู่สำหรับการฝึกข้อมูล

ตอนนี้ ชุดย่อยของข้อมูลแต่ละชุดย่อยเหล่านี้ถูกใช้เพื่อฝึกโครงสร้างการตัดสินใจที่แยกจากกัน เนื่องจากข้อมูลที่ป้อนเข้าไปในต้นไม้แต่ละต้นนั้นมีลักษณะเฉพาะ โอกาสที่ต้นไม้ใดๆ จะมีผลกระทบต่อต้นอื่นจึงต่ำมาก ผลลัพธ์สุดท้ายที่ต้นไม้เหล่านี้มอบให้จะถูกรวบรวมและประมวลผลเพื่อให้ได้ผลลัพธ์ ดังนั้น ประโยคที่สองก็เป็นจริงเช่นกัน

ไตรมาสที่ 2 คุณจะเห็นข้อความแจ้งสองรายการด้านล่าง คุณจะต้องอ่านทั้งสองอย่างอย่างรอบคอบแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกของทั้งสองคำสั่ง คำถามเชิงบริบทคือ เลือกข้อความที่เป็นจริงเกี่ยวกับการส่งเสริมต้นไม้

ผู้เรียนที่อ่อนแอในแผนภูมิส่งเสริมเป็นอิสระจากกัน
ประสิทธิภาพของผู้เรียนที่อ่อนแอจะถูกรวบรวมและรวบรวมทั้งหมดเพื่อปรับปรุงประสิทธิภาพโดยรวมของแผนภูมิที่ได้รับการส่งเสริม
เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
ทั้งข้อความที่หนึ่งและสองเป็นความจริง
ไม่มีตัวเลือกใดที่กล่าวถึงข้างต้น

ตอบ หากคุณต้องเข้าใจว่าการส่งเสริมต้นไม้เกิดขึ้นได้อย่างไร คุณจะเข้าใจและสามารถแยกแยะข้อความที่ถูกต้องออกจากข้อความซึ่งเป็นเท็จได้ ดังนั้น ต้นไม้ที่ได้รับการส่งเสริมจึงถูกสร้างขึ้นเมื่อมีผู้เรียนที่อ่อนแอจำนวนมากเชื่อมต่อกันเป็นชุด ต้นไม้แต่ละต้นที่อยู่ในลำดับนี้มีจุดมุ่งหมายเพียงอย่างเดียวคือ เพื่อลดข้อผิดพลาดที่บรรพบุรุษได้ทำไว้

หากต้นไม้เชื่อมต่อกันในลักษณะนี้ ต้นไม้ทั้งหมดไม่สามารถแยกจากกัน ดังนั้นจึงทำให้ข้อความแรกเป็นเท็จ เมื่อมาถึงข้อความสั่งที่สอง ส่วนใหญ่จะเป็นความจริงเพราะในแผนผังที่มีการเพิ่มประสิทธิภาพ นั่นคือวิธีการที่ใช้เพื่อปรับปรุงประสิทธิภาพโดยรวมของแบบจำลอง ตัวเลือกที่ถูกต้องจะเป็น B กล่าวคือ มีเพียงข้อความสั่งที่สองเท่านั้นที่เป็น TRUE และข้อความสั่งที่หนึ่งเป็นเท็จ

ไตรมาสที่ 3 คุณจะเห็นข้อความสี่รายการด้านล่าง คุณจะต้องอ่านทั้งหมดอย่างละเอียดแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกที่ตามหลังข้อความทั้งสี่ คำถามเชิงบริบทคือ เลือกข้อความที่เป็นจริงเกี่ยวกับ Radom Forests และ Gradient Boosting ensemble method

ทั้งฟอเรสต์สุ่มและเมธอด Ensemble ส่งเสริมการไล่ระดับสีสามารถใช้เพื่อจัดประเภทได้
Random Forests สามารถใช้เพื่อดำเนินการจัดหมวดหมู่ได้ ในขณะที่วิธีการไล่ระดับการไล่ระดับสีสามารถดำเนินการได้เฉพาะการถดถอยเท่านั้น
สามารถใช้การเร่งการไล่ระดับสีเพื่อดำเนินการจัดประเภทได้ ในขณะที่วิธีสุ่มฟอเรสต์สามารถดำเนินการถดถอยได้เท่านั้น
ทั้งฟอเรสต์สุ่มและเมธอดการเร่งการไล่ระดับสีสามารถใช้เพื่อทำการถดถอยได้
เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
ทั้งข้อความที่หนึ่งและสองเป็นความจริง
ประโยคที่สามเท่านั้นที่เป็น TRUE
เฉพาะข้อความที่สี่เท่านั้นที่เป็น TRUE
เฉพาะข้อความที่หนึ่งและสี่เท่านั้นที่เป็น TRUE

ตอบ คำตอบสำหรับคำถามนี้ตรงไปตรงมา ทั้งสองวิธีทั้งมวลนี้มีความสามารถมากในการทำทั้งงานการจำแนกและการถดถอย ดังนั้น คำตอบของคำถามนี้คือ F เพราะมีเพียงข้อความที่หนึ่งและสี่เท่านั้นที่เป็น TRUE

ไตรมาสที่ 4 คุณจะเห็นข้อความสี่รายการด้านล่าง คุณจะต้องอ่านทั้งหมดอย่างละเอียดแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกที่ตามหลังข้อความทั้งสี่ คำถามตามบริบทคือ ให้พิจารณาป่าไม้แบบสุ่ม แล้วอะไรจะเกิดขึ้นกับต้นไม้แต่ละต้นในป่าสุ่ม?

ต้นไม้แต่ละต้นที่ประกอบขึ้นเป็นป่าสุ่มจะขึ้นอยู่กับส่วนย่อยของคุณสมบัติทั้งหมด
แต่ละอันในป่าสุ่มถูกสร้างขึ้นจากคุณสมบัติทั้งหมด
ต้นไม้แต่ละต้นในป่าสุ่มถูกสร้างขึ้นจากชุดย่อยของการสังเกตทั้งหมดที่มีอยู่
ต้นไม้แต่ละต้นในป่าสุ่มถูกสร้างขึ้นจากชุดสังเกตการณ์ทั้งหมด
เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
ทั้งข้อความที่หนึ่งและสองเป็นความจริง
ประโยคที่สามเท่านั้นที่เป็น TRUE
เฉพาะข้อความที่สี่เท่านั้นที่เป็น TRUE
ทั้งข้อความที่หนึ่งและสี่เป็น TRUE
ทั้งข้อความที่หนึ่งและสามเป็น TRUE
ทั้งข้อความที่ 2 และ 3 เป็น TRUE
ทั้งข้อความที่ 2 และ 4 เป็น TRUE

ตอบ การสร้างป่าสุ่มขึ้นอยู่กับแนวคิดของการบรรจุถุง เพื่อสร้างป่าสุ่ม เซตย่อยเล็ก ๆ จะถูกนำมาจากการสังเกตและลักษณะเด่น ค่าที่ได้รับหลังจากแยกส่วนย่อยออกแล้วจะถูกป้อนเข้าในแผนผังการตัดสินใจแบบเอกพจน์ จากนั้นค่าทั้งหมดจากแผนผังการตัดสินใจดังกล่าวทั้งหมดจะถูกรวบรวมเพื่อทำการตัดสินใจขั้นสุดท้าย นั่นหมายถึงข้อความเดียวที่ถูกต้องคือหนึ่งและสาม ดังนั้น ตัวเลือกที่เหมาะสมคือ G.

Q5 คุณจะเห็นข้อความสี่รายการด้านล่าง คุณจะต้องอ่านทั้งหมดอย่างละเอียดแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกที่ตามหลังข้อความทั้งสี่ คำถามเชิงบริบทคือ เลือกข้อความสั่งที่ถูกต้องเกี่ยวกับไฮเปอร์พารามิเตอร์ที่เรียกว่า "max_depth" ของอัลกอริธึมการเพิ่มระดับการไล่ระดับสี

การเลือกค่าที่ต่ำกว่าของไฮเปอร์พารามิเตอร์นี้จะดีกว่าถ้าความแม่นยำของชุดการตรวจสอบความถูกต้องใกล้เคียงกัน
การเลือกค่าที่สูงกว่าของไฮเปอร์พารามิเตอร์นี้จะดีกว่าหากความแม่นยำของชุดการตรวจสอบความถูกต้องใกล้เคียงกัน
หากเราต้องเพิ่มค่าของไฮเปอร์พารามิเตอร์นี้ โอกาสที่โมเดลนี้จะใส่ข้อมูลเกินจริงก็เพิ่มขึ้น
หากเราต้องการเพิ่มค่าของไฮเปอร์พารามิเตอร์นี้ โอกาสที่โมเดลนี้จะลดข้อมูลลงจริงก็เพิ่มขึ้น
เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
ทั้งข้อความที่หนึ่งและสองเป็นความจริง
ประโยคที่สามเท่านั้นที่เป็น TRUE
เฉพาะข้อความที่สี่เท่านั้นที่เป็น TRUE
ทั้งข้อความที่หนึ่งและสี่เป็น TRUE
ทั้งข้อความที่หนึ่งและสามเป็น TRUE
ทั้งข้อความที่ 2 และ 3 เป็น TRUE
ทั้งข้อความที่ 2 และ 4 เป็น TRUE

ตอบ พารามิเตอร์ไฮเปอร์ max_deep ควบคุมความลึกจนกว่าการเร่งการไล่ระดับสีจะสร้างแบบจำลองข้อมูลที่นำเสนอต่อหน้า หากคุณยังคงเพิ่มค่าของไฮเปอร์พารามิเตอร์นี้ต่อไป โมเดลนั้นก็จะถูกผูกไว้จนเกินพอดี ดังนั้น ข้อความที่ 3 ถูกต้อง หากเรามีคะแนนเท่ากันในข้อมูลการตรวจสอบ โดยทั่วไปเราจะชอบโมเดลที่มีความลึกต่ำกว่า ดังนั้น ข้อความที่หนึ่งและสามจึงถูกต้อง ดังนั้น คำตอบของคำถามสัมภาษณ์ในแผนภูมิการตัดสินใจนี้คือ g

Q6. คุณจะเห็นข้อความสี่รายการด้านล่าง คุณจะต้องอ่านทั้งหมดอย่างละเอียดแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกที่ตามหลังข้อความทั้งสี่ คำถามตามบริบทคือวิธีการใดต่อไปนี้ไม่มีอัตราการเรียนรู้เป็นหนึ่งในไฮเปอร์พารามิเตอร์ที่ปรับได้

ต้นไม้เสริม.
AdaBoost
ป่าสุ่ม
การเร่งความเร็วไล่ระดับ
เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
ทั้งข้อความที่หนึ่งและสองเป็นความจริง
ประโยคที่สามเท่านั้นที่เป็น TRUE
เฉพาะข้อความที่สี่เท่านั้นที่เป็น TRUE
ทั้งข้อความที่หนึ่งและสี่เป็น TRUE
ทั้งข้อความที่หนึ่งและสามเป็น TRUE
ทั้งข้อความที่ 2 และ 3 เป็น TRUE
ทั้งข้อความที่ 2 และ 4 เป็น TRUE

ตอบ เฉพาะต้นไม้พิเศษและฟอเรสต์สุ่มเท่านั้นไม่มีอัตราการเรียนรู้เป็นหนึ่งในไฮเปอร์พารามิเตอร์ที่ปรับแต่งได้ ดังนั้น คำตอบจะเป็น g เพราะข้อความที่ 1 และ 3 เป็น TRUE

Q7. เลือกตัวเลือกที่เป็นจริง

เฉพาะในอัลกอริทึมของฟอเรสต์สุ่มเท่านั้น ค่าจริงสามารถจัดการได้โดยทำให้ไม่ต่อเนื่องกัน
เฉพาะในอัลกอริธึมของการเพิ่มเกรเดียนต์เท่านั้น ค่าจริงสามารถจัดการได้โดยทำให้ไม่ต่อเนื่องกัน
ทั้งในฟอเรสต์สุ่มและการเพิ่มเกรเดียนต์ ค่าจริงสามารถจัดการได้โดยการทำให้ไม่ต่อเนื่องกัน
ไม่มีตัวเลือกใดที่กล่าวถึงข้างต้น

ตอบ ทั้งสองอัลกอริธึมมีความสามารถ ทั้งคู่สามารถจัดการคุณสมบัติที่มีค่าจริงในตัวได้อย่างง่ายดาย ดังนั้น คำตอบสำหรับคำถามและคำตอบในการสัมภาษณ์ต้นไม้การตัดสินใจนี้คือ C

Q8. เลือกหนึ่งตัวเลือกจากรายการด้านล่าง คำถามคือ เลือกอัลกอริธึมที่ไม่ใช่อัลกอริธึมการเรียนรู้ทั้งมวล

ไล่โทนสี
AdaBoost
ต้นไม้เสริม
ป่าสุ่ม
ต้นไม้ตัดสินใจ

ตอบ คำถามนี้ตรงไปตรงมา อัลกอริธึมเดียวเท่านั้นไม่ใช่อัลกอริธึมการเรียนรู้ทั้งมวล กฎง่ายๆ ข้อหนึ่งที่ต้องจำไว้คือวิธีการเรียนรู้แบบกลุ่มใด ๆ จะเกี่ยวข้องกับการใช้แผนผังการตัดสินใจมากกว่าหนึ่งรายการ เนื่องจากในตัวเลือก E มีเพียงแผนผังการตัดสินใจแบบเอกพจน์ นั่นจึงไม่ใช่อัลกอริธึมการเรียนรู้ทั้งมวล ดังนั้น คำตอบสำหรับคำถามนี้คือ E (แผนภูมิต้นไม้การตัดสินใจ)

Q9. คุณจะเห็นข้อความแจ้งสองรายการด้านล่าง คุณจะต้องอ่านทั้งสองอย่างอย่างรอบคอบแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกของทั้งสองคำสั่ง คำถามตามบริบทคือ ข้อใดต่อไปนี้จะเป็นความจริงในกระบวนทัศน์การเรียนรู้ทั้งมวล

จำนวนต้นไม้ในชุดควรสูงที่สุด
คุณจะยังสามารถตีความสิ่งที่เกิดขึ้นได้แม้หลังจากที่คุณใช้อัลกอริธึมของ Random Forest แล้ว
เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
ทั้งข้อความที่หนึ่งและสองเป็นความจริง
ไม่มีตัวเลือกใดที่กล่าวถึงข้างต้น

ตอบ เนื่องจากวิธีการเรียนรู้แบบกลุ่มใด ๆ จะขึ้นอยู่กับการรวมต้นไม้การตัดสินใจจำนวนมหาศาล (ซึ่งโดยตัวมันเองเป็นผู้เรียนที่อ่อนแอมาก) เข้าด้วยกัน ดังนั้นจึงเป็นประโยชน์เสมอที่จะมีต้นไม้จำนวนมากขึ้นเพื่อสร้างวิธีการรวมกลุ่มของคุณ อย่างไรก็ตาม อัลกอริธึมของสุ่มฟอเรสต์ก็เหมือนกล่องดำ คุณจะไม่รู้ว่าเกิดอะไรขึ้นภายในโมเดล ดังนั้น คุณจะต้องสูญเสียความสามารถในการตีความทั้งหมดหลังจากที่คุณใช้อัลกอริธึมฟอเรสต์แบบสุ่ม ดังนั้น คำตอบที่ถูกต้องสำหรับคำถามนี้คือ A เพราะข้อความที่เป็นความจริงเท่านั้นคือข้อความที่หนึ่ง

Q10. ตอบเฉพาะใน TRUE หรือ FALSE อัลกอริธึมของการบรรจุถุงทำงานได้ดีที่สุดสำหรับรุ่นที่มีความแปรปรวนสูงและอคติต่ำ

ตอบ จริง. การบรรจุถุงนั้นเหมาะสมที่สุดที่จะใช้สำหรับแบบจำลองที่มีความแปรปรวนสูงและอคติต่ำ

Q11. . คุณจะเห็นข้อความแจ้งสองรายการด้านล่าง คุณจะต้องอ่านทั้งสองอย่างอย่างรอบคอบแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกของทั้งสองคำสั่ง คำถามตามบริบทคือ เลือกแนวคิดที่เหมาะสมสำหรับต้นไม้ส่งเสริมการไล่ระดับสี

ในทุกขั้นตอนของการเพิ่มประสิทธิภาพ อัลกอริธึมจะแนะนำทรีอื่นเพื่อให้แน่ใจว่าปัญหาโมเดลปัจจุบันทั้งหมดได้รับการชดเชย
เราสามารถใช้อัลกอริธึมการไล่ระดับสีเพื่อลดการสูญเสียฟังก์ชัน
เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
ทั้งข้อความที่หนึ่งและสองเป็นความจริง
ไม่มีตัวเลือกใดที่กล่าวถึงข้างต้น

ตอบ คำตอบสำหรับคำถามนี้คือ C หมายความว่าทั้งสองตัวเลือกเป็นจริง สำหรับคำสั่งแรก นั่นคือวิธีการทำงานของอัลกอริธึมการบูสต์ ต้นไม้ใหม่ที่นำมาใช้ในแบบจำลองนี้เป็นเพียงการเพิ่มประสิทธิภาพของอัลกอริธึมที่มีอยู่ ใช่ อัลกอริทึมการไล่ระดับสีแบบเกรเดียนท์เป็นฟังก์ชันที่ใช้เพื่อลดฟังก์ชันการสูญเสีย

คำถามที่ 12 ในอัลกอริธึมการไล่ระดับสี ข้อความใดต่อไปนี้ถูกต้องเกี่ยวกับอัตราการเรียนรู้

อัตราการเรียนรู้ที่คุณกำหนดควรสูงที่สุด
อัตราการเรียนรู้ที่คุณตั้งไว้ไม่ควรสูงที่สุดเท่าที่จะเป็นไปได้ แต่ให้ต่ำที่สุดเท่าที่จะทำได้
อัตราการเรียนรู้ควรต่ำแต่ไม่ต่ำมาก
อัตราการเรียนรู้ที่คุณกำหนดควรสูงแต่ไม่สูงมาก

ตอบ อัตราการเรียนรู้ควรต่ำแต่ไม่ต่ำมาก ดังนั้นคำตอบสำหรับคำถามและคำตอบในการสัมภาษณ์ต้นไม้การตัดสินใจนี้จะเป็นทางเลือก C

เช็คเอาท์: คำถามสัมภาษณ์เกี่ยวกับการเรียนรู้ของเครื่อง

อะไรต่อไป?

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับโครงสร้างการตัดสินใจ แมชชีนเลิร์นนิง โปรดดูที่ IIIT-B & upGrad's PG Diploma in Machine Learning & AI ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมอย่างเข้มงวดมากกว่า 450 ชั่วโมง กรณีศึกษามากกว่า 30+ การมอบหมายงาน, สถานะศิษย์เก่า IIIT-B, 5+ โครงการหลักที่ใช้งานได้จริง & ความช่วยเหลือด้านงานกับบริษัทชั้นนำ

จะปรับปรุงโครงสร้างการตัดสินใจได้อย่างไร?

โครงสร้างการตัดสินใจเป็นเครื่องมือในการสร้างภาพช่วยอย่างง่าย โดยแสดงจุดอิสระหรือการตัดสินใจแบบมีเงื่อนไขเป็นโหนดและผลลัพธ์ที่เป็นไปได้ต่างๆ เป็นใบไม้ พูดง่ายๆ ก็คือ โครงสร้างการตัดสินใจคือแบบจำลองของกระบวนการตัดสินใจ คุณสามารถปรับปรุงแผนผังการตัดสินใจได้โดยทำให้แน่ใจว่าเกณฑ์การหยุดมีความชัดเจนอยู่เสมอ เมื่อเกณฑ์การหยุดไม่ชัดเจน จะทำให้เกิดความสงสัยว่าจำเป็นต้องมีการสำรวจเพิ่มเติมหรือไม่ และยังทำให้เกิดความสงสัยว่าควรหยุดหรือไม่ โครงสร้างการตัดสินใจควรสร้างในลักษณะที่ง่ายต่อการติดตามและไม่สับสนกับผู้อ่าน

ทำไมความแม่นยำของแผนผังการตัดสินใจจึงต่ำมาก

ความแม่นยำของแผนผังการตัดสินใจต่ำกว่าที่เราคาดไว้ สิ่งนี้สามารถเกิดขึ้นได้เนื่องจากสาเหตุต่อไปนี้: ข้อมูลไม่ดี - การใช้ข้อมูลที่ถูกต้องสำหรับอัลกอริธึมการเรียนรู้ของเครื่องเป็นสิ่งสำคัญมาก ข้อมูลที่ไม่ถูกต้องสามารถนำไปสู่ผลลัพธ์ที่ไม่ถูกต้อง ความสุ่ม - บางครั้งระบบมีความซับซ้อนมากจนไม่สามารถคาดการณ์ว่าจะเกิดอะไรขึ้นในอนาคต ในกรณีนี้ ความแม่นยำของโครงสร้างการตัดสินใจจะลดลงเช่นกัน Overfitting - โครงสร้างการตัดสินใจอาจไม่สามารถจับภาพเอกลักษณ์ของข้อมูลได้ ดังนั้นจึงถือได้ว่าเป็นภาพรวม หากใช้ข้อมูลเดียวกันในการปรับโครงสร้าง ข้อมูลก็จะพอดีกับข้อมูลมากเกินไป

ต้นไม้ตัดสินใจถูกตัดแต่งอย่างไร?

แผนภูมิการตัดสินใจถูกตัดแต่งโดยใช้อัลกอริทึมแบบแยกส่วนและแบบผูกมัด อัลกอริทึมแบบแยกส่วนและแบบผูกจะค้นหาวิธีแก้ปัญหาที่เหมาะสมที่สุดสำหรับแผนผังการตัดสินใจโดยวนซ้ำผ่านโหนดของแผนผังและกำหนดขอบเขตค่าของฟังก์ชันวัตถุประสงค์ในการวนซ้ำแต่ละครั้ง หน้าที่วัตถุประสงค์คือคุณค่าของโครงสร้างการตัดสินใจต่อธุรกิจ ที่แต่ละโหนด อัลกอริธึมจะลบกิ่งของต้นไม้หรือตัดกิ่งไปยังโหนดใหม่ ส่วนที่ดีที่สุดคือสามารถตัดแต่งกิ่งได้แม้ว่าจะนำไปสู่วิธีแก้ปัญหาที่ไม่เหมาะสมก็ตาม