คำถามและคำตอบในการสัมภาษณ์ต้นไม้ตัดสินใจ [สำหรับผู้เริ่มต้นและผู้มีประสบการณ์]

เผยแพร่แล้ว: 2020-09-22

ในโลกของการเรียนรู้ของเครื่อง แผนผังการตัดสินใจเป็นหนึ่งในนั้น ถ้าไม่ใช่อัลกอริธึมที่น่านับถือที่สุด ต้นไม้แห่งการตัดสินใจก็ทรงพลังเช่นกัน แผนผังการตัดสินใจใช้เพื่อทำนายค่าต่อเนื่อง (การถดถอย) หรือทำนายคลาส (ดำเนินการจำแนกหรือจัดประเภท) ของอินสแตนซ์ที่จัดเตรียมให้กับอัลกอริทึม

ต้นไม้ตัดสินใจคล้ายกับแผนผังลำดับงานในโครงสร้าง โหนดของแผนผังการตัดสินใจใดๆ แสดงถึงการทดสอบที่ทำกับแอตทริบิวต์ แต่ละสาขาของแผนผังการตัดสินใจเป็นตัวแทนของผลการตรวจสอบที่ดำเนินการในแต่ละโหนด โหนดของลีฟทุกอัน (ซึ่งเรียกอีกอย่างว่าโหนดเทอร์มินัล) มีป้ายกำกับของคลาส

นั่นคือโครงสร้างของต้นไม้ อย่างไรก็ตาม ความนิยมที่เพิ่มขึ้นของต้นไม้ตัดสินใจไม่ได้เกิดจากวิธีการสร้าง ความโปร่งใสของต้นไม้ทำให้ต้นไม้มีสถานะเป็นของตัวเองในโลกที่มีอัลกอริธึมที่ทรงพลังและมีประโยชน์ จริงๆ แล้ว คุณสามารถทำทุกอย่างด้วยมือสำหรับแผนผังการตัดสินใจขนาดเล็ก และคุณสามารถคาดการณ์ได้ว่าแผนผังการตัดสินใจจะเกิดขึ้นได้อย่างไร สำหรับต้นไม้ที่มีขนาดใหญ่ขึ้น การออกกำลังกายนี้ค่อนข้างจะน่าเบื่อ

อย่างไรก็ตาม นั่นไม่ได้หมายความว่าคุณจะไม่สามารถเข้าใจว่าต้นไม้กำลังทำอะไรในแต่ละโหนด ความสามารถในการเข้าใจสิ่งที่เกิดขึ้นเบื้องหลังหรือภายใต้ประทุนนั้นสร้างความแตกต่างให้กับแผนผังการตัดสินใจกับอัลกอริธึมแมชชีนเลิร์นนิงอื่น ๆ

ดังที่เราได้เห็นแล้วว่าแผนผังการตัดสินใจมีความสำคัญเพียงใด ต้นไม้แห่งการตัดสินใจก็มีความสำคัญสำหรับมืออาชีพด้านแมชชีนเลิร์นนิงหรือนักวิทยาศาสตร์ด้านข้อมูลโดยธรรมชาติ เพื่อช่วยให้คุณเข้าใจแนวคิดนี้และในขณะเดียวกันก็ช่วยให้คุณได้รับ zing ที่พิเศษในการสัมภาษณ์ของคุณ เราได้จัดทำรายการคำถามและคำตอบในการสัมภาษณ์ต้นไม้การตัดสินใจและคำถามและคำตอบในการสัมภาษณ์ต้นไม้การตัดสินใจ คำถามเหล่านี้จะช่วยคุณในการสัมภาษณ์ พยายามแก้คำถามแต่ละข้อเหล่านี้ก่อนอ่านคำตอบเพื่อให้ได้ประโยชน์สูงสุดจากคำถามเหล่านี้

สารบัญ

คำถามและคำตอบในการสัมภาษณ์ต้นไม้ตัดสินใจ

ไตรมาสที่ 1 คุณจะเห็นข้อความแจ้งสองรายการด้านล่าง คุณจะต้องอ่านทั้งสองอย่างอย่างรอบคอบแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกของทั้งสองคำสั่ง คำถามตามบริบทคือ เลือกข้อความที่เป็นจริงเกี่ยวกับการตัดต้นไม้

  1. ต้นไม้แต่ละต้นไม่ได้ขึ้นอยู่กับต้นไม้อื่นเลย
  2. เพื่อปรับปรุงประสิทธิภาพโดยรวมของแบบจำลอง การรวมจะนำมาจากผู้เรียนที่อ่อนแอ วิธีนี้เรียกว่าการห่อต้นไม้
  3. เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
  4. ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
  5. ทั้งข้อความที่หนึ่งและสองเป็นความจริง
  6. ไม่มีตัวเลือกใดที่กล่าวถึงข้างต้น

ตอบ คำตอบที่ถูกต้องสำหรับคำถามนี้คือ C เพราะสำหรับต้นไม้บรรจุถุง ข้อความทั้งสองนี้เป็นความจริง ในการแพ็คต้นไม้หรือการรวมบูตสแตรป เป้าหมายหลักของการใช้อัลกอริธึมนี้คือการลดปริมาณของความแปรปรวนที่มีอยู่ในแผนผังการตัดสินใจ กลไกของการสร้างแผนผังการบรรจุถุงคือการแทนที่ ชุดย่อยจำนวนหนึ่งจะนำมาจากตัวอย่างที่มีอยู่สำหรับการฝึกข้อมูล

ตอนนี้ ชุดย่อยของข้อมูลแต่ละชุดย่อยเหล่านี้ถูกใช้เพื่อฝึกโครงสร้างการตัดสินใจที่แยกจากกัน เนื่องจากข้อมูลที่ป้อนเข้าไปในต้นไม้แต่ละต้นนั้นมีลักษณะเฉพาะ โอกาสที่ต้นไม้ใดๆ จะมีผลกระทบต่อต้นอื่นจึงต่ำมาก ผลลัพธ์สุดท้ายที่ต้นไม้เหล่านี้มอบให้จะถูกรวบรวมและประมวลผลเพื่อให้ได้ผลลัพธ์ ดังนั้น ประโยคที่สองก็เป็นจริงเช่นกัน

ไตรมาสที่ 2 คุณจะเห็นข้อความแจ้งสองรายการด้านล่าง คุณจะต้องอ่านทั้งสองอย่างอย่างรอบคอบแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกของทั้งสองคำสั่ง คำถามเชิงบริบทคือ เลือกข้อความที่เป็นจริงเกี่ยวกับการส่งเสริมต้นไม้

  1. ผู้เรียนที่อ่อนแอในแผนภูมิส่งเสริมเป็นอิสระจากกัน
  2. ประสิทธิภาพของผู้เรียนที่อ่อนแอจะถูกรวบรวมและรวบรวมทั้งหมดเพื่อปรับปรุงประสิทธิภาพโดยรวมของแผนภูมิที่ได้รับการส่งเสริม
  3. เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
  4. ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
  5. ทั้งข้อความที่หนึ่งและสองเป็นความจริง
  6. ไม่มีตัวเลือกใดที่กล่าวถึงข้างต้น

ตอบ หากคุณต้องเข้าใจว่าการส่งเสริมต้นไม้เกิดขึ้นได้อย่างไร คุณจะเข้าใจและสามารถแยกแยะข้อความที่ถูกต้องออกจากข้อความซึ่งเป็นเท็จได้ ดังนั้น ต้นไม้ที่ได้รับการส่งเสริมจึงถูกสร้างขึ้นเมื่อมีผู้เรียนที่อ่อนแอจำนวนมากเชื่อมต่อกันเป็นชุด ต้นไม้แต่ละต้นที่อยู่ในลำดับนี้มีจุดมุ่งหมายเพียงอย่างเดียวคือ เพื่อลดข้อผิดพลาดที่บรรพบุรุษได้ทำไว้

หากต้นไม้เชื่อมต่อกันในลักษณะนี้ ต้นไม้ทั้งหมดไม่สามารถแยกจากกัน ดังนั้นจึงทำให้ข้อความแรกเป็นเท็จ เมื่อมาถึงข้อความสั่งที่สอง ส่วนใหญ่จะเป็นความจริงเพราะในแผนผังที่มีการเพิ่มประสิทธิภาพ นั่นคือวิธีการที่ใช้เพื่อปรับปรุงประสิทธิภาพโดยรวมของแบบจำลอง ตัวเลือกที่ถูกต้องจะเป็น B กล่าวคือ มีเพียงข้อความสั่งที่สองเท่านั้นที่เป็น TRUE และข้อความสั่งที่หนึ่งเป็นเท็จ

ไตรมาสที่ 3 คุณจะเห็นข้อความสี่รายการด้านล่าง คุณจะต้องอ่านทั้งหมดอย่างละเอียดแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกที่ตามหลังข้อความทั้งสี่ คำถามเชิงบริบทคือ เลือกข้อความที่เป็นจริงเกี่ยวกับ Radom Forests และ Gradient Boosting ensemble method

  1. ทั้งฟอเรสต์สุ่มและเมธอด Ensemble ส่งเสริมการไล่ระดับสีสามารถใช้เพื่อจัดประเภทได้
  2. Random Forests สามารถใช้เพื่อดำเนินการจัดหมวดหมู่ได้ ในขณะที่วิธีการไล่ระดับการไล่ระดับสีสามารถดำเนินการได้เฉพาะการถดถอยเท่านั้น
  3. สามารถใช้การเร่งการไล่ระดับสีเพื่อดำเนินการจัดประเภทได้ ในขณะที่วิธีสุ่มฟอเรสต์สามารถดำเนินการถดถอยได้เท่านั้น
  4. ทั้งฟอเรสต์สุ่มและเมธอดการเร่งการไล่ระดับสีสามารถใช้เพื่อทำการถดถอยได้
  5. เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
  6. ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
  7. ทั้งข้อความที่หนึ่งและสองเป็นความจริง
  8. ประโยคที่สามเท่านั้นที่เป็น TRUE
  9. เฉพาะข้อความที่สี่เท่านั้นที่เป็น TRUE
  10. เฉพาะข้อความที่หนึ่งและสี่เท่านั้นที่เป็น TRUE

ตอบ คำตอบสำหรับคำถามนี้ตรงไปตรงมา ทั้งสองวิธีทั้งมวลนี้มีความสามารถมากในการทำทั้งงานการจำแนกและการถดถอย ดังนั้น คำตอบของคำถามนี้คือ F เพราะมีเพียงข้อความที่หนึ่งและสี่เท่านั้นที่เป็น TRUE

ไตรมาสที่ 4 คุณจะเห็นข้อความสี่รายการด้านล่าง คุณจะต้องอ่านทั้งหมดอย่างละเอียดแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกที่ตามหลังข้อความทั้งสี่ คำถามตามบริบทคือ ให้พิจารณาป่าไม้แบบสุ่ม แล้วอะไรจะเกิดขึ้นกับต้นไม้แต่ละต้นในป่าสุ่ม?

  1. ต้นไม้แต่ละต้นที่ประกอบขึ้นเป็นป่าสุ่มจะขึ้นอยู่กับส่วนย่อยของคุณสมบัติทั้งหมด
  2. แต่ละอันในป่าสุ่มถูกสร้างขึ้นจากคุณสมบัติทั้งหมด
  3. ต้นไม้แต่ละต้นในป่าสุ่มถูกสร้างขึ้นจากชุดย่อยของการสังเกตทั้งหมดที่มีอยู่
  4. ต้นไม้แต่ละต้นในป่าสุ่มถูกสร้างขึ้นจากชุดสังเกตการณ์ทั้งหมด
  5. เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
  6. ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
  7. ทั้งข้อความที่หนึ่งและสองเป็นความจริง
  8. ประโยคที่สามเท่านั้นที่เป็น TRUE
  9. เฉพาะข้อความที่สี่เท่านั้นที่เป็น TRUE
  10. ทั้งข้อความที่หนึ่งและสี่เป็น TRUE
  11. ทั้งข้อความที่หนึ่งและสามเป็น TRUE
  12. ทั้งข้อความที่ 2 และ 3 เป็น TRUE
  13. ทั้งข้อความที่ 2 และ 4 เป็น TRUE

ตอบ การสร้างป่าสุ่มขึ้นอยู่กับแนวคิดของการบรรจุถุง เพื่อสร้างป่าสุ่ม เซตย่อยเล็ก ๆ จะถูกนำมาจากการสังเกตและลักษณะเด่น ค่าที่ได้รับหลังจากแยกส่วนย่อยออกแล้วจะถูกป้อนเข้าในแผนผังการตัดสินใจแบบเอกพจน์ จากนั้นค่าทั้งหมดจากแผนผังการตัดสินใจดังกล่าวทั้งหมดจะถูกรวบรวมเพื่อทำการตัดสินใจขั้นสุดท้าย นั่นหมายถึงข้อความเดียวที่ถูกต้องคือหนึ่งและสาม ดังนั้น ตัวเลือกที่เหมาะสมคือ G.

Q5 คุณจะเห็นข้อความสี่รายการด้านล่าง คุณจะต้องอ่านทั้งหมดอย่างละเอียดแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกที่ตามหลังข้อความทั้งสี่ คำถามเชิงบริบทคือ เลือกข้อความสั่งที่ถูกต้องเกี่ยวกับไฮเปอร์พารามิเตอร์ที่เรียกว่า "max_depth" ของอัลกอริธึมการเพิ่มระดับการไล่ระดับสี

  1. การเลือกค่าที่ต่ำกว่าของไฮเปอร์พารามิเตอร์นี้จะดีกว่าถ้าความแม่นยำของชุดการตรวจสอบความถูกต้องใกล้เคียงกัน
  2. การเลือกค่าที่สูงกว่าของไฮเปอร์พารามิเตอร์นี้จะดีกว่าหากความแม่นยำของชุดการตรวจสอบความถูกต้องใกล้เคียงกัน
  3. หากเราต้องเพิ่มค่าของไฮเปอร์พารามิเตอร์นี้ โอกาสที่โมเดลนี้จะใส่ข้อมูลเกินจริงก็เพิ่มขึ้น
  4. หากเราต้องการเพิ่มค่าของไฮเปอร์พารามิเตอร์นี้ โอกาสที่โมเดลนี้จะลดข้อมูลลงจริงก็เพิ่มขึ้น
  5. เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
  6. ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
  7. ทั้งข้อความที่หนึ่งและสองเป็นความจริง
  8. ประโยคที่สามเท่านั้นที่เป็น TRUE
  9. เฉพาะข้อความที่สี่เท่านั้นที่เป็น TRUE
  10. ทั้งข้อความที่หนึ่งและสี่เป็น TRUE
  11. ทั้งข้อความที่หนึ่งและสามเป็น TRUE
  12. ทั้งข้อความที่ 2 และ 3 เป็น TRUE
  13. ทั้งข้อความที่ 2 และ 4 เป็น TRUE

ตอบ พารามิเตอร์ไฮเปอร์ max_deep ควบคุมความลึกจนกว่าการเร่งการไล่ระดับสีจะสร้างแบบจำลองข้อมูลที่นำเสนอต่อหน้า หากคุณยังคงเพิ่มค่าของไฮเปอร์พารามิเตอร์นี้ต่อไป โมเดลนั้นก็จะถูกผูกไว้จนเกินพอดี ดังนั้น ข้อความที่ 3 ถูกต้อง หากเรามีคะแนนเท่ากันในข้อมูลการตรวจสอบ โดยทั่วไปเราจะชอบโมเดลที่มีความลึกต่ำกว่า ดังนั้น ข้อความที่หนึ่งและสามจึงถูกต้อง ดังนั้น คำตอบของคำถามสัมภาษณ์ในแผนภูมิการตัดสินใจนี้คือ g

Q6. คุณจะเห็นข้อความสี่รายการด้านล่าง คุณจะต้องอ่านทั้งหมดอย่างละเอียดแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกที่ตามหลังข้อความทั้งสี่ คำถามตามบริบทคือวิธีการใดต่อไปนี้ไม่มีอัตราการเรียนรู้เป็นหนึ่งในไฮเปอร์พารามิเตอร์ที่ปรับได้

  1. ต้นไม้เสริม.
  2. AdaBoost
  3. ป่าสุ่ม
  4. การเร่งความเร็วไล่ระดับ
  5. เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
  6. ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
  7. ทั้งข้อความที่หนึ่งและสองเป็นความจริง
  8. ประโยคที่สามเท่านั้นที่เป็น TRUE
  9. เฉพาะข้อความที่สี่เท่านั้นที่เป็น TRUE
  10. ทั้งข้อความที่หนึ่งและสี่เป็น TRUE
  11. ทั้งข้อความที่หนึ่งและสามเป็น TRUE
  12. ทั้งข้อความที่ 2 และ 3 เป็น TRUE
  13. ทั้งข้อความที่ 2 และ 4 เป็น TRUE

ตอบ เฉพาะต้นไม้พิเศษและฟอเรสต์สุ่มเท่านั้นไม่มีอัตราการเรียนรู้เป็นหนึ่งในไฮเปอร์พารามิเตอร์ที่ปรับแต่งได้ ดังนั้น คำตอบจะเป็น g เพราะข้อความที่ 1 และ 3 เป็น TRUE

Q7. เลือกตัวเลือกที่เป็นจริง

  1. เฉพาะในอัลกอริทึมของฟอเรสต์สุ่มเท่านั้น ค่าจริงสามารถจัดการได้โดยทำให้ไม่ต่อเนื่องกัน
  2. เฉพาะในอัลกอริธึมของการเพิ่มเกรเดียนต์เท่านั้น ค่าจริงสามารถจัดการได้โดยทำให้ไม่ต่อเนื่องกัน
  3. ทั้งในฟอเรสต์สุ่มและการเพิ่มเกรเดียนต์ ค่าจริงสามารถจัดการได้โดยการทำให้ไม่ต่อเนื่องกัน
  4. ไม่มีตัวเลือกใดที่กล่าวถึงข้างต้น

ตอบ ทั้งสองอัลกอริธึมมีความสามารถ ทั้งคู่สามารถจัดการคุณสมบัติที่มีค่าจริงในตัวได้อย่างง่ายดาย ดังนั้น คำตอบสำหรับคำถามและคำตอบในการสัมภาษณ์ต้นไม้การตัดสินใจนี้คือ C

Q8. เลือกหนึ่งตัวเลือกจากรายการด้านล่าง คำถามคือ เลือกอัลกอริธึมที่ไม่ใช่อัลกอริธึมการเรียนรู้ทั้งมวล

  1. ไล่โทนสี
  2. AdaBoost
  3. ต้นไม้เสริม
  4. ป่าสุ่ม
  5. ต้นไม้ตัดสินใจ

ตอบ คำถามนี้ตรงไปตรงมา อัลกอริธึมเดียวเท่านั้นไม่ใช่อัลกอริธึมการเรียนรู้ทั้งมวล กฎง่ายๆ ข้อหนึ่งที่ต้องจำไว้คือวิธีการเรียนรู้แบบกลุ่มใด ๆ จะเกี่ยวข้องกับการใช้แผนผังการตัดสินใจมากกว่าหนึ่งรายการ เนื่องจากในตัวเลือก E มีเพียงแผนผังการตัดสินใจแบบเอกพจน์ นั่นจึงไม่ใช่อัลกอริธึมการเรียนรู้ทั้งมวล ดังนั้น คำตอบสำหรับคำถามนี้คือ E (แผนภูมิต้นไม้การตัดสินใจ)

Q9. คุณจะเห็นข้อความแจ้งสองรายการด้านล่าง คุณจะต้องอ่านทั้งสองอย่างอย่างรอบคอบแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกของทั้งสองคำสั่ง คำถามตามบริบทคือ ข้อใดต่อไปนี้จะเป็นความจริงในกระบวนทัศน์การเรียนรู้ทั้งมวล

  1. จำนวนต้นไม้ในชุดควรสูงที่สุด
  2. คุณจะยังสามารถตีความสิ่งที่เกิดขึ้นได้แม้หลังจากที่คุณใช้อัลกอริธึมของ Random Forest แล้ว
  3. เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
  4. ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
  5. ทั้งข้อความที่หนึ่งและสองเป็นความจริง
  6. ไม่มีตัวเลือกใดที่กล่าวถึงข้างต้น

ตอบ เนื่องจากวิธีการเรียนรู้แบบกลุ่มใด ๆ จะขึ้นอยู่กับการรวมต้นไม้การตัดสินใจจำนวนมหาศาล (ซึ่งโดยตัวมันเองเป็นผู้เรียนที่อ่อนแอมาก) เข้าด้วยกัน ดังนั้นจึงเป็นประโยชน์เสมอที่จะมีต้นไม้จำนวนมากขึ้นเพื่อสร้างวิธีการรวมกลุ่มของคุณ อย่างไรก็ตาม อัลกอริธึมของสุ่มฟอเรสต์ก็เหมือนกล่องดำ คุณจะไม่รู้ว่าเกิดอะไรขึ้นภายในโมเดล ดังนั้น คุณจะต้องสูญเสียความสามารถในการตีความทั้งหมดหลังจากที่คุณใช้อัลกอริธึมฟอเรสต์แบบสุ่ม ดังนั้น คำตอบที่ถูกต้องสำหรับคำถามนี้คือ A เพราะข้อความที่เป็นความจริงเท่านั้นคือข้อความที่หนึ่ง

Q10. ตอบเฉพาะใน TRUE หรือ FALSE อัลกอริธึมของการบรรจุถุงทำงานได้ดีที่สุดสำหรับรุ่นที่มีความแปรปรวนสูงและอคติต่ำ

ตอบ จริง. การบรรจุถุงนั้นเหมาะสมที่สุดที่จะใช้สำหรับแบบจำลองที่มีความแปรปรวนสูงและอคติต่ำ

Q11. . คุณจะเห็นข้อความแจ้งสองรายการด้านล่าง คุณจะต้องอ่านทั้งสองอย่างอย่างรอบคอบแล้วเลือกหนึ่งในตัวเลือกจากตัวเลือกของทั้งสองคำสั่ง คำถามตามบริบทคือ เลือกแนวคิดที่เหมาะสมสำหรับต้นไม้ส่งเสริมการไล่ระดับสี

  1. ในทุกขั้นตอนของการเพิ่มประสิทธิภาพ อัลกอริธึมจะแนะนำทรีอื่นเพื่อให้แน่ใจว่าปัญหาโมเดลปัจจุบันทั้งหมดได้รับการชดเชย
  2. เราสามารถใช้อัลกอริธึมการไล่ระดับสีเพื่อลดการสูญเสียฟังก์ชัน
  3. เฉพาะข้อความที่หนึ่งเท่านั้นที่เป็น TRUE
  4. ข้อความสั่งที่สองเท่านั้นที่เป็น TRUE
  5. ทั้งข้อความที่หนึ่งและสองเป็นความจริง
  6. ไม่มีตัวเลือกใดที่กล่าวถึงข้างต้น

ตอบ คำตอบสำหรับคำถามนี้คือ C หมายความว่าทั้งสองตัวเลือกเป็นจริง สำหรับคำสั่งแรก นั่นคือวิธีการทำงานของอัลกอริธึมการบูสต์ ต้นไม้ใหม่ที่นำมาใช้ในแบบจำลองนี้เป็นเพียงการเพิ่มประสิทธิภาพของอัลกอริธึมที่มีอยู่ ใช่ อัลกอริทึมการไล่ระดับสีแบบเกรเดียนท์เป็นฟังก์ชันที่ใช้เพื่อลดฟังก์ชันการสูญเสีย

คำถามที่ 12 ในอัลกอริธึมการไล่ระดับสี ข้อความใดต่อไปนี้ถูกต้องเกี่ยวกับอัตราการเรียนรู้

  1. อัตราการเรียนรู้ที่คุณกำหนดควรสูงที่สุด
  2. อัตราการเรียนรู้ที่คุณตั้งไว้ไม่ควรสูงที่สุดเท่าที่จะเป็นไปได้ แต่ให้ต่ำที่สุดเท่าที่จะทำได้
  3. อัตราการเรียนรู้ควรต่ำแต่ไม่ต่ำมาก
  4. อัตราการเรียนรู้ที่คุณกำหนดควรสูงแต่ไม่สูงมาก

ตอบ อัตราการเรียนรู้ควรต่ำแต่ไม่ต่ำมาก ดังนั้นคำตอบสำหรับคำถามและคำตอบในการสัมภาษณ์ต้นไม้การตัดสินใจนี้จะเป็นทางเลือก C

เช็คเอาท์: คำถามสัมภาษณ์เกี่ยวกับการเรียนรู้ของเครื่อง

อะไรต่อไป?

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับโครงสร้างการตัดสินใจ แมชชีนเลิร์นนิง โปรดดูที่ IIIT-B & upGrad's PG Diploma in Machine Learning & AI ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมอย่างเข้มงวดมากกว่า 450 ชั่วโมง กรณีศึกษามากกว่า 30+ การมอบหมายงาน, สถานะศิษย์เก่า IIIT-B, 5+ โครงการหลักที่ใช้งานได้จริง & ความช่วยเหลือด้านงานกับบริษัทชั้นนำ

จะปรับปรุงโครงสร้างการตัดสินใจได้อย่างไร?

โครงสร้างการตัดสินใจเป็นเครื่องมือในการสร้างภาพช่วยอย่างง่าย โดยแสดงจุดอิสระหรือการตัดสินใจแบบมีเงื่อนไขเป็นโหนดและผลลัพธ์ที่เป็นไปได้ต่างๆ เป็นใบไม้ พูดง่ายๆ ก็คือ โครงสร้างการตัดสินใจคือแบบจำลองของกระบวนการตัดสินใจ คุณสามารถปรับปรุงแผนผังการตัดสินใจได้โดยทำให้แน่ใจว่าเกณฑ์การหยุดมีความชัดเจนอยู่เสมอ เมื่อเกณฑ์การหยุดไม่ชัดเจน จะทำให้เกิดความสงสัยว่าจำเป็นต้องมีการสำรวจเพิ่มเติมหรือไม่ และยังทำให้เกิดความสงสัยว่าควรหยุดหรือไม่ โครงสร้างการตัดสินใจควรสร้างในลักษณะที่ง่ายต่อการติดตามและไม่สับสนกับผู้อ่าน

ทำไมความแม่นยำของแผนผังการตัดสินใจจึงต่ำมาก

ความแม่นยำของแผนผังการตัดสินใจต่ำกว่าที่เราคาดไว้ สิ่งนี้สามารถเกิดขึ้นได้เนื่องจากสาเหตุต่อไปนี้: ข้อมูลไม่ดี - การใช้ข้อมูลที่ถูกต้องสำหรับอัลกอริธึมการเรียนรู้ของเครื่องเป็นสิ่งสำคัญมาก ข้อมูลที่ไม่ถูกต้องสามารถนำไปสู่ผลลัพธ์ที่ไม่ถูกต้อง ความสุ่ม - บางครั้งระบบมีความซับซ้อนมากจนไม่สามารถคาดการณ์ว่าจะเกิดอะไรขึ้นในอนาคต ในกรณีนี้ ความแม่นยำของโครงสร้างการตัดสินใจจะลดลงเช่นกัน Overfitting - โครงสร้างการตัดสินใจอาจไม่สามารถจับภาพเอกลักษณ์ของข้อมูลได้ ดังนั้นจึงถือได้ว่าเป็นภาพรวม หากใช้ข้อมูลเดียวกันในการปรับโครงสร้าง ข้อมูลก็จะพอดีกับข้อมูลมากเกินไป

ต้นไม้ตัดสินใจถูกตัดแต่งอย่างไร?

แผนภูมิการตัดสินใจถูกตัดแต่งโดยใช้อัลกอริทึมแบบแยกส่วนและแบบผูกมัด อัลกอริทึมแบบแยกส่วนและแบบผูกจะค้นหาวิธีแก้ปัญหาที่เหมาะสมที่สุดสำหรับแผนผังการตัดสินใจโดยวนซ้ำผ่านโหนดของแผนผังและกำหนดขอบเขตค่าของฟังก์ชันวัตถุประสงค์ในการวนซ้ำแต่ละครั้ง หน้าที่วัตถุประสงค์คือคุณค่าของโครงสร้างการตัดสินใจต่อธุรกิจ ที่แต่ละโหนด อัลกอริธึมจะลบกิ่งของต้นไม้หรือตัดกิ่งไปยังโหนดใหม่ ส่วนที่ดีที่สุดคือสามารถตัดแต่งกิ่งได้แม้ว่าจะนำไปสู่วิธีแก้ปัญหาที่ไม่เหมาะสมก็ตาม