7 สุดยอดโครงการการเรียนรู้เชิงลึกใน Github ที่คุณควรลองวันนี้ [2022]

เผยแพร่แล้ว: 2021-01-04

ในฐานะนักเรียนที่มีการเรียนรู้เชิงลึก หนึ่งในสิ่งที่สำคัญที่สุดที่คุณสามารถทำได้คือติดตามข่าวสารล่าสุดเกี่ยวกับการพัฒนาในสาขาของคุณ เพื่อช่วยคุณในเรื่องนั้น เราได้เตรียมรายการโครงการการเรียนรู้เชิงลึกต่อไปนี้ใน Github เนื่องจาก Github เป็นจุดเริ่มต้นที่ดีที่สุด

โปรเจ็กต์ต่อไปนี้มีดาวมากที่สุดและมีส่วนร่วมกับ Github ในขณะที่เขียนบทความนี้ อย่างไรก็ตาม โครงการเหล่านี้บางโครงการไม่อยู่ในอันดับต้น ๆ แต่มีความเกี่ยวข้องสูงเนื่องจากการบังคับใช้ มาเริ่มกันเลย:

สารบัญ

โครงการเรียนรู้เชิงลึกยอดนิยมใน Github

1. Keras

ในขณะที่เขียนบทความนี้ Keras อยู่ในอันดับต้น ๆ ของโครงการการเรียนรู้เชิงลึกใน Github มีดาวประมาณ 49,000 ดวงและส้อม 18.4 อัน Keras เป็น API การเรียนรู้เชิงลึกซึ่งทำงานบน TensorFlow ซึ่งเป็นแพลตฟอร์มการเรียนรู้ของเครื่องยอดนิยม Keras เขียนด้วยภาษา Python และช่วยให้คุณทำงานในโครงการการเรียนรู้เชิงลึกได้อย่างง่ายดายมาก โดยหลักแล้วจะช่วยคุณในการทำวิจัยอย่างรวดเร็วและปรับใช้ได้เร็วขึ้น

เนื่องจากสร้างขึ้นบน TensorFlow จึงมอบข้อดีของแพลตฟอร์มนั้นให้คุณด้วย ซึ่งหมายความว่าคุณสามารถปรับใช้โมเดล Keras ของคุณผ่านอุปกรณ์ฝังตัวใดก็ได้ มีการเข้าถึงที่ยอดเยี่ยมและมีกรอบงานระดับอุตสาหกรรมเพื่อปรับขนาดคลัสเตอร์ขนาดใหญ่ของ GPU

การเรียนรู้เกี่ยวกับ Keras เป็นสิ่งจำเป็นสำหรับนักเรียนที่มีการเรียนรู้เชิงลึก ตรวจสอบให้แน่ใจว่าคุณคุ้นเคยกับ TensorFlow และแอปพลิเคชันต่าง ๆ ก่อนที่คุณจะเริ่มเรียนรู้เกี่ยวกับ Keras เพราะหากไม่มีอดีต อย่างหลังจะยากเกินกว่าจะเชี่ยวชาญ

2. เอกสารการเรียนรู้เชิงลึกที่อ้างถึงมากที่สุด

โครงการ Github นี้แบ่งปันเอกสารการเรียนรู้เชิงลึกที่อ้างถึงมากที่สุดซึ่งตีพิมพ์ระหว่างปี 2555 ถึง 2559 ไม่มีบทความใด ๆ ที่ตีพิมพ์หลังจากปี 2559 เนื่องจากนักวิจัยและนักวิชาการได้เผยแพร่เอกสารจำนวนมากตั้งแต่นั้นมา และมันก็ล้นหลามเกินไปสำหรับผู้สร้างโครงการ .

แม้ว่าเอกสารอาจดูล้าสมัย แต่คุณควรให้พวกเขาอ่านเพราะเป็น 'คลาสสิก' ของเอกสารการเรียนรู้เชิงลึก บทความมากมายในโครงการนี้มีการอ้างอิงมากกว่า 200 รายการ เอกสารบางฉบับมีการอ้างอิงมากกว่า 800 รายการ ดังนั้นคุณจึงสามารถเข้าใจความนิยมและการนำไปใช้ได้

เอกสารที่นำเสนอในรายการนี้ครอบคลุมหลายด้าน เช่น Speech, NLPs, Recurrent Neural Networks (RNNs), Convolutional Network Models, Robotics และอื่นๆ อีกมากมาย

3. คาเฟ่

Caffe เป็นเฟรมเวิร์กแบบเปิดสำหรับการเรียนรู้เชิงลึก เป็นผลิตภัณฑ์ของ Berkeley AI Research/ The Berkeley Vision and Learning Center แม้ว่าครีเอเตอร์ของ Caffe ต้องการให้โฟกัสไปที่ Computer Vision แต่ก็กลายเป็นห้องสมุดเอนกประสงค์สำหรับการเรียนรู้เชิงลึก Caffe มีชุมชนนักวิจัยทางวิชาการและผู้ใช้มืออาชีพที่เฟื่องฟู ดังนั้นคุณจึงสามารถขอความช่วยเหลือได้อย่างง่ายดายขณะทำงานกับมัน

เหมาะอย่างยิ่งสำหรับการปรับใช้เครือข่าย Convolutional และการทำงานเกี่ยวกับคำพูด การมองเห็น และโครงการการเรียนรู้เชิงลึกอื่นๆ มันสามารถประมวลผลภาพมากกว่า 60 ล้านภาพในหนึ่งวัน ดังนั้นจึงเป็นเครื่องมือที่เหมาะสมสำหรับโครงการวิชันซิสเต็มเช่นกัน

4. สมุดบันทึกการเรียนรู้ของเครื่อง

หนึ่งในโปรเจ็กต์การเรียนรู้เชิงลึกที่ได้รับความนิยมมากที่สุดใน Github Machine Learning Notebooks คือโปรเจ็กต์ที่ช่วยให้คุณเรียนรู้พื้นฐานของแมชชีนเลิร์นนิงใน Python มีโค้ดตัวอย่างพร้อมเฉลยแบบฝึกหัดด้วย มีโน้ตบุ๊ก Jupyter หลายเครื่องที่แสดงให้คุณเห็นถึงพื้นฐานการเรียนรู้ของเครื่อง (และการเรียนรู้เชิงลึก) ใน Python ผ่าน TensorFlow และ Scikit-Learn

สมุดบันทึก Jupyter เป็นแบบโต้ตอบและช่วยให้คุณลองใช้รหัสภายในสมุดบันทึก เป็นผลิตภัณฑ์ของ jupyter.org และเป็นเครื่องมือโอเพ่นซอร์ส

แบบฝึกหัดส่วนใหญ่ที่นำเสนอในโครงการนี้มีอยู่ในหนังสือ Hands-on Machine Learning with Scikit-Learn และ TensorFlow ก่อนที่คุณจะเริ่มเรียนรู้จากโครงงานนี้ ตรวจสอบให้แน่ใจว่าคุณรู้จัก TensorFlow และ Scikit-Learn แล้ว ทั้งสองเป็นเครื่องมือที่นิยมกันอย่างแพร่หลายในหมู่ผู้เชี่ยวชาญด้านการเรียนรู้เชิงลึก และคุณต้องคุ้นเคยกับพวกเขาก่อนที่จะเริ่มทำงานกับสิ่งนี้

คุณอาจพบว่ามีความท้าทายเล็กน้อยในการทำงานกับปัญหาบางอย่างที่แชร์ในโครงการนี้ ดังนั้นจึงควร เรียนหลักสูตรแมชชีนเลิ ร์นนิง และรับประสบการณ์การเรียนรู้เฉพาะบุคคล

5. MXNet – Apache

MXNet เป็นเฟรมเวิร์กการเรียนรู้เชิงลึกแบบโอเพนซอร์สที่ช่วยคุณในการสร้างต้นแบบการวิจัยอย่างรวดเร็วและยืดหยุ่นสำหรับการผลิตที่รวดเร็ว ช่วยให้การฝึกอบรมแบบกระจายที่ปรับขนาดได้เนื่องจากมีการรองรับ Horovod และ Parameter Server มันถูกรวมเข้ากับ Python และรองรับภาษาที่โดดเด่นหลายภาษาเช่น C ++, Julia, Clojure, Perl, R และ Scala

อีกเหตุผลหนึ่งที่ทำให้ได้รับความนิยมอย่างมากคือระบบนิเวศที่กว้างขวางของห้องสมุดและเครื่องมือสำหรับอนุกรมเวลา การประมวลผลภาษาธรรมชาติ คอมพิวเตอร์วิทัศน์ และอื่นๆ เครื่องมือและไลบรารีบางส่วน ได้แก่ GluconTS, GluconCV, D2L.ai และ GluconNLP เครื่องมือและไลบรารีทั้งหมดเหล่านี้ช่วยคุณในโดเมนเฉพาะของการเรียนรู้เชิงลึก ตัวอย่างเช่น GluconCV เป็นชุดเครื่องมือสำหรับการมองเห็นด้วยคอมพิวเตอร์ซึ่งช่วยให้คุณประเมินท่าทางและการตรวจจับวัตถุได้ มีใบอนุญาต Apache-2.0 และเป็นหนึ่งในสิ่งที่ต้องมีสำหรับมืออาชีพด้านการเรียนรู้เชิงลึก ดังนั้นอย่าลืมทำความคุ้นเคยกับมันในขณะที่ศึกษาอยู่เหมือนกัน

ชำระเงิน: โครงการการเรียนรู้ของเครื่องยอดนิยมใน Github

6. fastai

fastai เป็นห้องสมุดสำหรับการฝึกอบรมโครงข่ายประสาทที่ง่ายและรวดเร็ว มีการรองรับแบบสำเร็จรูปสำหรับตาราง การมองเห็น การกรองการทำงานร่วมกัน และโมเดลข้อความ นี่เป็นหนึ่งในโปรเจ็กต์การเรียนรู้เชิงลึกใน Github เพราะมีบทช่วยสอนและคำแนะนำเกี่ยวกับการใช้ fast.ai เช่นกัน

การทำความคุ้นเคยกับไลบรารีและเฟรมเวิร์กที่แพร่หลายจะช่วยให้คุณเป็นมืออาชีพในการเรียนรู้เชิงลึก ดังนั้นคุณต้องคุ้นเคยกับพวกเขา โปรเจ็กต์นี้ยังมีตัวอย่างการใช้งานและกรณีการใช้งานของ fast.ai เพื่อให้คุณเข้าใจวิธีนำไลบรารี่นี้ไปใช้ในโครงการในโลกแห่งความเป็นจริงได้อย่างง่ายดาย

7. CNTK

Microsoft Cognitive Toolkit (CNTK) เป็นชุดเครื่องมือโอเพนซอร์สสำหรับแอปพลิเคชันการเรียนรู้เชิงลึก คุณสามารถรวมประเภทโมเดลที่โดดเด่นต่างๆ เข้าด้วยกันและรับรู้ได้อย่างรวดเร็ว โมเดลบางประเภทนั้นรวมถึงเครือข่ายที่เกิดซ้ำ DNN ฟีดฟอร์เวิร์ดและ CNN ใช้การเรียนรู้ SGD (การไล่ระดับสีสุ่ม) กับการทำคู่ขนานอัตโนมัติและการสร้างความแตกต่างระหว่างเซิร์ฟเวอร์

มีใบอนุญาตโอเพ่นซอร์สและหนึ่งในชุมชนที่ดีที่สุด CNTK พบแอปพลิเคชันในหลายอุตสาหกรรม และคุณอาจต้องคุ้นเคยกับแอปพลิเคชันนี้จึงจะใช้งานได้ในบางโครงการ ดังนั้น จะเป็นการดีที่สุดหากคุณเรียนรู้เกี่ยวกับมันก่อนที่จะเข้าสู่ตลาด Microsoft Cognitive Toolkit ได้รับการอัปเดตอย่างต่อเนื่องเช่นกัน ดังนั้นคุณจะไม่พบเครื่องมือหรือการใช้งานที่ล้าสมัยในนั้น

ยังอ่าน: โครงการ Python อันดับต้น ๆ ใน Github

เรียนรู้เพิ่มเติมเกี่ยวกับการเรียนรู้เชิงลึก

การเรียนรู้เชิงลึกและหัวข้อที่เกี่ยวข้องอาจต้องใช้ความพยายามอย่างมาก เราขอแนะนำให้คุณอ่านเพิ่มเติมในหัวข้อนี้เพื่อทำความเข้าใจการเรียนรู้เชิงลึกอย่างมีประสิทธิภาพมากขึ้น

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับแมชชีนเลิร์นนิง โปรดดูที่ IIIT-B & upGrad's PG Diploma in Machine Learning & AI ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมที่เข้มงวดมากกว่า 450 ชั่วโมง กรณีศึกษาและการมอบหมายมากกว่า 30 รายการ IIIT- สถานะศิษย์เก่า B, 5+ โครงการหลักที่ใช้งานได้จริง & ความช่วยเหลือด้านงานกับบริษัทชั้นนำ

เหตุใดจึงต้องใช้ GitHub สำหรับโครงการการเรียนรู้เชิงลึก

GitHub เป็นหนึ่งในแพลตฟอร์มที่เป็นที่ต้องการมากที่สุดในปัจจุบัน โดยมีวัตถุประสงค์เพื่อบังคับใช้การควบคุมเวอร์ชันในโปรเจ็กต์ที่เขียนด้วยภาษาโปรแกรมต่างๆ ใช้แอปพลิเคชันชื่อ Git ที่ใช้กลไกการควบคุมเวอร์ชันนี้กับโค้ด เมื่อพูดถึงวิทยาศาสตร์ข้อมูลและ AI GitHub เป็นที่นิยมอย่างมากในหมู่นักวิทยาศาสตร์ด้านข้อมูล ช่วยให้ทำงานร่วมกันได้อย่างปลอดภัยและควบคุมโครงการเข้ารหัสได้ดียิ่งขึ้น เพื่อให้สามารถแก้ไขหรือย้อนกลับได้ทุกเมื่อที่ต้องการ GitHub ช่วยให้นักวิทยาศาสตร์ข้อมูลมีความยืดหยุ่นและสามารถเข้าถึงโค้ดได้มากขึ้น เพื่อเขียนโค้ดของตนเองและปรับใช้โมเดลในสภาพแวดล้อมการผลิตได้อย่างราบรื่น GitHub มีวิชาที่เป็นมาตรฐาน เช่น แมชชีนเลิร์นนิงและการเรียนรู้เชิงลึกสำหรับบุคคลทั่วไป

ปัจจุบันอุตสาหกรรมใดบ้างที่ใช้การเรียนรู้เชิงลึก

ปัจจุบันมีการใช้ Deep Learning ในอุตสาหกรรมต่างๆ การใช้งานที่น่าสนใจที่สุดบางส่วนสามารถพบได้ในอุตสาหกรรมยานยนต์ ซึ่งใช้การเรียนรู้เชิงลึกสำหรับรถยนต์ขับเคลื่อนอัตโนมัติ ในช่วงเวลาของโซเชียลมีเดียที่เรามักถูกโจมตีด้วยข่าวปลอม การเรียนรู้เชิงลึกช่วยระบุและกรองข่าวหลอกลวง โดยแสดงเฉพาะข่าวจริงและข่าวที่สอดคล้องกับความชอบของผู้อ่านเท่านั้น อุตสาหกรรมบันเทิงยังใช้การเรียนรู้เชิงลึกเพื่อมอบประสบการณ์การรับชมที่เป็นส่วนตัวสูงพร้อมคำแนะนำการแสดงที่ปรับแต่งมาโดยเฉพาะ นอกจากนี้ยังปฏิวัติตลาดการสร้างภาพยนตร์ การตัดต่อ และการสร้างเนื้อหาโดยรวม

ก่อนเรียน deep learning ต้องรู้อะไรบ้าง?

มีข้อกำหนดเบื้องต้นเฉพาะในการวางแผนอาชีพที่ประสบความสำเร็จในการเรียนรู้เชิงลึก การเรียนรู้เชิงลึกเป็นสาขาที่ซับซ้อนของ AI ที่มาพร้อมกับแนวคิดขั้นสูง ดังนั้นการเรียนรู้หรือรู้ข้อกำหนดเบื้องต้นเหล่านี้จะช่วยให้คุณมีเส้นทางการเรียนรู้เชิงลึกที่ราบรื่นและมีประสิทธิภาพ คณิตศาสตร์เป็นหัวใจสำคัญของการเรียนรู้อย่างลึกซึ้ง คุณต้องรู้พีชคณิตเชิงเส้น สถิติ ความน่าจะเป็น และแคลคูลัส จากนั้นคุณควรรู้พื้นฐานของภาษาการเขียนโปรแกรม Python และแนวคิดพื้นฐานของการเรียนรู้ของเครื่องด้วย เนื่องจากการเรียนรู้เชิงลึกเป็นส่วนเฉพาะของการเรียนรู้ของเครื่อง