การถดถอยไอโซโทนิกในการเรียนรู้ของเครื่อง: การทำความเข้าใจการถดถอยในการเรียนรู้ของเครื่อง

เผยแพร่แล้ว: 2020-12-21

มีตัวแบบการถดถอยหลายประเภท (อัลกอริทึม) ที่ใช้ในการฝึกอบรมโปรแกรมการเรียนรู้ของเครื่อง เช่น การถดถอยเชิงเส้น ลอจิสติกส์ แนวสัน และ การถดถอยแบบแลซโซ่ ของเหล่านี้ แบบจำลองการถดถอยเชิงเส้นเป็นแบบจำลองการถดถอยพื้นฐานและใช้กันอย่างแพร่หลายมากที่สุด การถดถอยไอโซโทนิกในแมชชีนเลิ ร์นนิง อิงจากการถดถอยเชิงเส้น ดังนั้น ก่อนที่เราจะพูดถึงการถดถอยแบบไอโซโทนิก มาดูการถดถอยเชิงเส้นในการเรียนรู้ของเครื่องกันก่อน

สารบัญ

ทำความเข้าใจการถดถอยเชิงเส้นในการเรียนรู้ของเครื่อง

แหล่งที่มา

ตัวแบบการถดถอยเชิงเส้นใช้เพื่อกำหนดความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระ โดยจะถือว่ามีความสัมพันธ์เชิงเส้นซึ่งแสดงโดยเส้นที่พอดีที่สุดระหว่างตัวแปรทั้งสอง สมการ y= mx + c + e ใช้เพื่อแสดงถึงตัวแบบการถดถอยเชิงเส้นโดยที่:

m= ความชันของเส้นตรง

c= สกัดกั้น

e= ข้อผิดพลาดในรุ่น

ตัวแบบการถดถอยเชิงเส้นมีความอ่อนไหวต่อค่าผิดปกติ มีความยืดหยุ่นสูง ดังนั้นจึงไม่สามารถใช้กับข้อมูลขนาดใหญ่ได้ เมื่อโมเดลนี้ใช้กับข้อมูลการทดสอบขนาดใหญ่ มีหลายอินสแตนซ์ที่อยู่นอกความชันของเส้น หรือที่เรียกว่าข้อผิดพลาดที่เหลือ วิธีการต่างๆ เช่น การทำให้เป็นมาตรฐาน L1 และ L2 อาจใช้เพื่อลดความชันของความชันของเส้นตรง แต่ก็ไม่ได้พิสูจน์ว่ามีประโยชน์

ต้องอ่าน: อธิบายแบบจำลองการเรียนรู้ของเครื่อง

ซึ่งจะจำกัดความถูกต้องของอัลกอริธึมการเรียนรู้ของเครื่อง วิธีการใหม่ของ การถดถอยแบบไอโซโทนิกในแมชชีนเลิ ร์นนิง กำลังถูกนำมาใช้เพื่อเอาชนะข้อจำกัดนี้ แม้ว่าในปัจจุบันจะไม่แพร่หลายนัก แต่แนวทางนี้มีประสิทธิภาพสูงและสามารถช่วยปรับปรุงความแม่นยำของโปรแกรมการเรียนรู้ของเครื่องได้

ทำความเข้าใจการถดถอยไอโซโทนิกในการเรียนรู้ของเครื่อง

ก่อนดำดิ่งสู่เรื่องทางเทคนิค เรามาทำความเข้าใจ การถดถอยแบบไอโซโทนิกในแมชชีนเลิ ร์นนิง ในแง่ของคนธรรมดาก่อน

เริ่มต้นด้วยการถอดรหัสคำว่า 'ไอโซโทนิก' คำว่า 'isotonic' มีรากศัพท์มาจากภาษากรีก ซึ่งประกอบด้วยสองส่วนคือ 'iso' และ 'tonic' ในที่นี้ 'iso' หมายถึงเท่ากับ และ 'tonic' หมายถึงการยืดกล้ามเนื้อ ในแง่ของอัลกอริธึมการเรียนรู้ของเครื่อง ดังนั้นการถดถอยแบบไอโซโทนิกจึงสามารถเข้าใจได้ว่าเป็นการยืดที่เท่ากันตามเส้นการถดถอยเชิงเส้น มันทำงานบนตัวแบบการถดถอยเชิงเส้น

มาดูแง่มุมต่างๆ ที่เกี่ยวข้องกับการถดถอยไอโซโทนิกที่จะช่วยให้เราเข้าใจได้ดีขึ้น

1. แบบจำลองเชิงเส้นเป็นชิ้นๆ

ดังที่กล่าวไว้ก่อนหน้านี้ ความชันของความชันของเส้นการถดถอยเชิงเส้นจะต้องถูกทำให้น้อยที่สุด ซึ่งใช้วิธีการปรับให้เป็นมาตรฐาน L1 และ L2 วิธีการถดถอยแบบไอโซโทนิกจะแตกต่างกันโดยสิ้นเชิงโดยแบ่งกราฟออกเป็นส่วนๆ โดยสร้างธรณีประตูและมีเส้นตรงสำหรับแต่ละส่วนที่เชื่อมต่อแบบ end-to-end

ตัวอย่างเช่น ในภาพด้านบน แกน X สามารถแบ่งออกเป็นส่วนที่เล็กกว่าต่างๆ ได้ กล่าวคือในช่วงเวลาที่เท่ากันคือ 10 ช่วงเวลาเหล่านี้แต่ละช่วงสามารถเรียกว่าเป็นถังขยะได้ เช่น bin1, bin2, bin3, bin4 และอื่นๆ บน. สมการเชิงเส้นจึงกลายเป็น

y= m1x1 + m2x2 + m3x3 +….. mnxn + c โดยที่:

m1, m2, m3….mn = ความชันของเส้นสำหรับถังขยะแต่ละถัง

ซึ่งช่วยลดข้อผิดพลาดและลดความชันของเส้นที่พอดีที่สุด

2. ความชันไม่เป็นลบ

เนื่องจากฟังก์ชันไอโซโทนิกเป็นฟังก์ชันโมโนโทนิก ความชันของสารละลายจึงไม่เป็นลบเสมอ ไม่อนุญาตให้มีความชันลดลงเมื่อเคลื่อนจากธรณีประตูหนึ่งไปยังอีกที่หนึ่ง จุดต่ำสุดในเกณฑ์ควรมากกว่าจุดสูงสุดในเกณฑ์ก่อนหน้าเสมอ

ตัวอย่างเช่น ให้ x1, x2, x3, x4…xn เป็นค่าของจุดข้อมูลที่พิจารณาสำหรับความชันในถังขยะ b1, b2, b3, b4…bn ตามกฎแล้ว ความชันไม่ควรเป็นค่าลบ เพราะฉะนั้น,

f(x1) <= f(x2) <= f(x3) <= f(x4)…<= f(xn).

ดังนั้นเราจึงเริ่มต้นด้วยจุดที่ต่ำกว่า (โดยที่ f(x1) เป็นจุดต่ำสุด) และค่อยๆ ย้ายไปยังจุดที่สูงกว่าด้วยแต่ละเกณฑ์ ความชันของธรณีประตูสามารถเป็นศูนย์ (เส้นแนวนอน) แต่ไม่สามารถเป็นค่าลบได้ (ความชันลง)

อ่าน: แนวคิดโครงการแมชชีนเลิร์นนิงสำหรับผู้เริ่มต้น

ข้อดีของการใช้การถดถอยแบบไอโซโทนิกในแบบจำลองการเรียนรู้ของเครื่อง

การใช้การถดถอยแบบไอโซโทนิกมีประโยชน์หลักสองประการ ซึ่งจะกล่าวถึงด้านล่าง

1. การปรับขนาดหลายมิติ

การถดถอยแบบไอโซโทนิกมีประโยชน์มากหากคุณมีตัวแปรอินพุตหลายตัว เราสามารถตรวจสอบทุกมิติและทุกฟังก์ชันและสอดแทรกเป็นเส้นตรงได้ ซึ่งช่วยให้ปรับขนาดหลายมิติได้ง่าย

2. การสอบเทียบค่าความน่าจะเป็น

ในการถดถอยโลจิสติก สมมติว่าเรามีตัวแปร x และเราแสดงถึงความน่าจะเป็น p(1) โดยที่ค่าความน่าจะเป็นของตัวแปรจะไม่เพิ่มขึ้น แต่ในความเป็นจริง ค่าความน่าจะเป็นสูงกว่าในโลกแห่งความเป็นจริง ในกรณีเช่นนี้ เพื่อวัตถุประสงค์ในการสอบเทียบหรือเพิ่มความน่าจะเป็นของตัวแปรดังกล่าว การถดถอยแบบไอโซโทนิกพิสูจน์ได้ว่ามีประโยชน์มาก

เช็คเอาท์: คำถามสัมภาษณ์เกี่ยวกับการเรียนรู้ของเครื่อง

ข้อเสียของการใช้การถดถอยไอโซโทนิกในแบบจำลองการเรียนรู้ของเครื่อง

มีข้อเสียที่สำคัญอย่างหนึ่งของการใช้การถดถอยแบบไอโซโทนิก ซึ่งจะอธิบายไว้ด้านล่าง

เสี่ยงต่อการฟิตมากเกินไป

มีความเสี่ยงสูงที่จะมีการเพิ่มพารามิเตอร์ไฮเปอร์พารามิเตอร์ (K) มากเกินไป เนื่องจากจำนวนของข้อจำกัดไอโซโทนิกและคุณสมบัติของตัวทำนายเพิ่มขึ้น แต่สามารถใช้วิธีการเวิร์กโฟลว์การตรวจสอบข้ามเพื่อจัดการปัญหาได้

บทสรุป

ปัจจุบันมีเพียงสามภาษาหลักเท่านั้นที่มีแพ็คเกจโอเพนซอร์ซที่มีการถดถอยแบบไอโซโทนิก อย่างไรก็ตาม เมื่อพิจารณาถึงประโยชน์ของการใช้ การถดถอยไอโซโทนิกใน ปัญหาการเรียนรู้ของเครื่อง ขอบเขต การใช้งาน และความพร้อมใช้งานของแพ็คเกจการถดถอยไอโซโทนิกจะเพิ่มขึ้นอย่างแน่นอนในอนาคต

เราสามารถเห็นการถดถอยแบบไอโซโทนิกแทนที่การถดถอยเชิงเส้นอย่างสำคัญ และวิธีการทำให้เป็นมาตรฐาน L1 และ L2 ดังนั้นเพื่อให้พร้อมในอนาคตจึงจำเป็นต้องปรับปรุงตัวเองและมีความรู้เกี่ยวกับการถดถอยไอโซโทนิกตั้งแต่ตอนนี้!

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับ การถดถอยแบบไอโซโทนิกในแมชชีนเลิ ร์นนิง หรือแนวคิดอื่นๆ ที่เกี่ยวข้องกับแมชชีนเลิร์นนิง คุณสามารถดู IIIT-B และ PG Diploma in Machine Learning และ AI ของ upGrad ซึ่งเป็นโปรแกรมขายดีที่สุดของอินเดียด้วยคะแนน 4.5 ดาว . หลักสูตรนี้มีการเรียนรู้มากกว่า 450 ชั่วโมง กรณีศึกษามากกว่า 30 รายการ และการมอบหมายงาน และช่วยให้นักเรียนเรียนรู้ทักษะตามความต้องการที่เกี่ยวข้องกับการเรียนรู้ของเครื่องและ AI

เหตุใดการถดถอยจึงมีนัยสำคัญในการเรียนรู้ของเครื่อง

การวิเคราะห์การถดถอย ซึ่งเป็นอัลกอริธึมการเรียนรู้ภายใต้การดูแลเป็นหนึ่งในแนวคิดพื้นฐานในการเรียนรู้ของเครื่อง การถดถอยใช้เพื่อสร้างความสัมพันธ์ระหว่างตัวแปรต่าง ๆ โดยพยายามประเมินว่าค่าของตัวหนึ่งมีอิทธิพลต่อตัวแปรอื่นอย่างไร ในด้านการเรียนรู้ของเครื่อง การถดถอยประกอบด้วยอัลกอริธึมทางคณิตศาสตร์ที่ซับซ้อนซึ่งช่วยประมาณผลลัพธ์ของตัวแปรเป้าหมายเฉพาะตามค่าที่เปลี่ยนแปลงอย่างต่อเนื่องของตัวแปรทำนายหนึ่งหรือหลายตัวแปร การวิเคราะห์การถดถอยที่ได้รับความนิยมมากที่สุดคือการถดถอยเชิงเส้น เนื่องจากง่ายต่อการใช้สำหรับการพยากรณ์และการทำนาย

แมชชีนเลิร์นนิงเหมือนกับวิทยาศาสตร์ข้อมูลหรือไม่

ด้วยคำศัพท์ต่างๆ เช่น วิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่องที่กลายเป็นกระแสหลักในปัจจุบัน หลายคนมักรู้สึกสับสนเกี่ยวกับความหมายที่แท้จริง ให้เราลองอธิบายที่นี่อย่างรวดเร็ว วิทยาศาสตร์ข้อมูลหมายถึงการศึกษาข้อมูลปริมาณมหาศาลที่สร้างโดยองค์กร นักวิทยาศาสตร์ด้านข้อมูลใช้เทคนิคต่างๆ ในการเปิดเผยข้อมูลเชิงลึกอันมีค่าจากข้อมูลนี้ เพื่อให้ธุรกิจได้รับประโยชน์สูงสุดและนำหน้าคู่แข่ง แมชชีนเลิร์นนิงแตกต่างจากวิทยาศาสตร์ข้อมูล มันใช้เทคนิควิทยาศาสตร์ข้อมูลเพื่อเรียนรู้เกี่ยวกับข้อมูลที่จะใช้ในการฝึกอบรมเครื่องจักร แมชชีนเลิร์นนิงใช้แบบจำลองทางคณิตศาสตร์ที่ซับซ้อนเพื่อช่วยให้คอมพิวเตอร์เรียนรู้โดยไม่ต้องอาศัยการแทรกแซงของมนุษย์

แมชชีนเลิร์นนิงเหมือนกับการเรียนรู้เชิงลึกหรือไม่

การเรียนรู้ของเครื่องเป็นส่วนย่อยของปัญญาประดิษฐ์ ใช้อัลกอริธึมหรือแบบจำลองที่สามารถวิเคราะห์ข้อมูล เรียนรู้จากข้อมูล จากนั้นนำการเรียนรู้เหล่านั้นไปใช้เพื่อช่วยในการตัดสินใจของคอมพิวเตอร์หรือเครื่องจักรโดยไม่ต้องอาศัยข้อมูลจากมนุษย์อย่างชัดเจน ในทางกลับกัน การเรียนรู้เชิงลึกเป็นสาขาย่อยของการเรียนรู้ของเครื่อง มันถูกใช้เพื่อจัดโครงสร้างอัลกอริทึมหรือแบบจำลองทางคณิตศาสตร์ในชั้นต่างๆ เพื่อพัฒนาโครงข่ายประสาทเทียมที่คล้ายกับโครงสร้างของสมองมนุษย์ โครงข่ายประสาทเทียมนี้สามารถเรียนรู้ได้ด้วยตัวเองและตัดสินใจอย่างชาญฉลาดโดยใช้กรอบงานเชิงตรรกะและการวิเคราะห์ข้อมูล