โครงการการเรียนรู้ของเครื่องโอเพ่นซอร์ส 17 อันดับแรก [สำหรับมือใหม่และผู้มีประสบการณ์]

เผยแพร่แล้ว: 2020-12-22

ปัญญาประดิษฐ์และการเรียนรู้ของเครื่องกำลังก่อให้เกิดการปฏิวัติอุตสาหกรรมครั้งที่สี่ ธุรกิจทุกรูปแบบและทุกขนาดในทุกอุตสาหกรรมต่างเปิดรับเทคโนโลยีที่ก่อกวนเหล่านี้เพื่อออกแบบโซลูชันที่เป็นนวัตกรรมใหม่ที่ตอบสนองความต้องการของลูกค้าเป้าหมาย

ดังนั้นจึงมีความต้องการอย่างมากสำหรับมืออาชีพที่มีความสามารถซึ่งมีความรอบรู้ในความแตกต่างของ AI และ ML ในความเป็นจริง บริษัทต่างๆ พร้อมที่จะจ่ายเงินจำนวนมหาศาลให้กับผู้สมัครที่สมควรได้รับทักษะที่เหมาะสม

ในแง่ของความต้องการทักษะ AI และ ML ที่เพิ่มขึ้น จะช่วยให้คุณมีโครงการในโลกแห่งความเป็นจริงไม่กี่โครงการภายใต้เข็มขัดของคุณ เมื่อคุณทำงานในโครงการ แสดงว่าคุณมีแรงผลักดันและความรู้ที่จะใช้เทคโนโลยีเหล่านี้

หากคุณกำลังมองหาโปรเจกต์การเรียนรู้ของเครื่องที่เป็นโอเพนซอร์สที่สร้างแรงบันดาลใจ คุณมาถูกที่แล้ว!

สารบัญ

โครงการการเรียนรู้ของเครื่องโอเพ่นซอร์ส

โครงการการเรียนรู้ของเครื่องโอเพ่นซอร์ส GitHub

1. DeOldify

DeOldify เป็นโมเดลการเรียนรู้เชิงลึกที่ออกแบบมาเพื่อปรับสีและคืนค่ารูปภาพเก่า คุณสามารถเพิ่มสีสันให้กับภาพถ่ายเก่าและฟุตเทจฟิล์มด้วย DeOldify ที่ช่วยสร้างชีวิตชีวาให้กับรูปภาพได้อย่างยอดเยี่ยม! ได้รับการอัปเกรดเพื่อให้การตกแต่งภาพระดับสีเทามีรายละเอียดและสมจริงยิ่งขึ้น นอกจากนี้ ผลลัพธ์ยังแสดงอคติสีน้ำเงินน้อยกว่ามากและมีข้อบกพร่องน้อยที่สุด

2. การจดจำใบหน้า

แอปพลิเคชั่นนี้เป็น "API การจดจำใบหน้าที่ง่ายที่สุดในโลกสำหรับ Python และบรรทัดคำสั่ง" มันสามารถจดจำและจัดการใบหน้าจาก Python หรือบรรทัดคำสั่งโดยใช้ซอฟต์แวร์จดจำใบหน้าที่ล้ำสมัยของ dlib โมเดลการเรียนรู้เชิงลึกนี้อ้างว่ามีอัตราความแม่นยำ 99.38% ต่อ เกณฑ์มาตรฐาน LFW คุณสามารถใช้เครื่องมือบรรทัดคำสั่ง “face_recognition” เพื่อทำการจดจำใบหน้าในโฟลเดอร์รูปภาพจากบรรทัดคำสั่งได้!

3. การโคลนเสียง

โปรเจ็กต์ ML นี้เป็นการนำ Transfer Learning จากการตรวจสอบผู้พูดไปเป็น Multispeaker Text-to-Speech Synthesis (SV2TTS) SV2TTS เป็นเครื่องมือการเรียนรู้เชิงลึกที่สามารถสร้างการแสดงตัวเลขของเสียงจากคลิปเสียงใดๆ และฝึกรูปแบบการอ่านออกเสียงข้อความเพื่อสรุปเป็นเสียงใหม่ แอปพลิเคชั่นนี้สามารถโคลนเสียงใดก็ได้ใน 5 วินาที และสร้างคำพูดตามอำเภอใจ ทั้งหมดในแบบเรียลไทม์!

4. NeuralTalk2

NeuralTalk2 เป็นรหัสจับภาพที่เขียนในภาษา Lua มันทำงานบน GPU และต้องใช้ Torch NeuralTalk2 สามารถบรรยายภาพ/วิดีโอด้วยประโยคโดยใช้ประโยชน์จาก Multimodal Recurrent Neural Network นี่เป็นเครื่องมือในอุดมคติสำหรับผู้สร้างเนื้อหาโซเชียลมีเดีย คุณสามารถสร้างคำบรรยายสำหรับรูปภาพ/วิดีโอของคุณ และคุณยังสามารถใช้โมเดลนี้เพื่อสร้างเนื้อหารูปภาพ/วิดีโอตลก ๆ (ที่มีคำบรรยายตลกๆ)

อ่าน: อาชีพในการเรียนรู้ของเครื่อง

5. U-GAT-IT

U-GAT-IT (Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation) เป็นโปรเจ็กต์ ML ที่เน้นความเรียบง่าย - เพื่อแปลภาพของบุคคลเป็นอวาตาร์อะนิเมะของพวกเขา โมเดลนี้สามารถแปลงรูปภาพที่ต้องการการเปลี่ยนแปลงแบบองค์รวม และรูปภาพที่ต้องใช้รูปร่างที่หลากหลายโดยใช้ประโยชน์จากเทคนิคการแปลรูปภาพเป็นรูปภาพแบบใหม่ที่ไม่มีผู้ดูแล ไม่จำเป็นต้องพูดว่านี่เป็นโครงการที่สมบูรณ์แบบสำหรับคนรักอะนิเมะ!

6. สเรซ

Srez ใช้การเรียนรู้เชิงลึกสำหรับภาพที่มีความละเอียดสูงเป็นพิเศษ โดยสามารถขยายขนาดภาพ 16 × 16 ได้สี่เท่าเพื่อสร้างภาพขนาด 64 × 64 ผลลัพธ์แสดงให้เห็นคุณลักษณะที่คมชัดและโดดเด่นซึ่งดูน่ายกย่องพอเมื่อเปรียบเทียบกับชุดข้อมูลการฝึก สถาปัตยกรรมพื้นฐานประกอบด้วย DCGAN ที่ยอมรับอินพุตรูปภาพขนาด 16 × 16 ไปยังเครือข่ายตัวสร้างแทนการแจกแจงเกาส์เซียนพหุนาม

7. เอวา

AVA เป็นเฟรมเวิร์กที่มีจุดมุ่งหมายเพื่อนำเสนอการวิเคราะห์ภาพที่ขับเคลื่อนด้วย AI และอัตโนมัติ “A” ตัวแรกใน AVA มีความหมายแฝงหลายประการ – เป็นเฟรมเวิร์กของอาลีบาบาที่มุ่งมั่นที่จะเป็น “โซลูชันอัตโนมัติที่ขับเคลื่อนด้วย AI ที่รองรับการวิเคราะห์แบบ Augmented” AVA ประกอบด้วยสามแพ็คเกจ ได้แก่ CKB (พื้นที่เก็บข้อมูลสำหรับความรู้เชิงประจักษ์สำหรับการแสดงภาพ/แผนภูมิ), DataWizard (ไลบรารีประมวลผลข้อมูล) และ ChartAdvisor (องค์ประกอบหลักที่แนะนำแผนภูมิตามข้อกำหนดของชุดข้อมูลและการวิเคราะห์)

8. เมกะทรอน

Megatron พัฒนาโดยทีมวิจัย Applied Deep Learning Research ของ NVIDIA เป็นหม้อแปลงไฟฟ้าทรงพลังที่สามารถฝึกโมเดลภาษาจำนวนมากเพื่อปรับปรุงประสิทธิภาพในขณะที่ขยายใหญ่ขึ้น เป็นโปรเจ็กต์ต่อเนื่องที่รองรับการฝึก BERT & GPT2 แบบคู่ขนานแบบหลายโหนดผ่านความแม่นยำแบบผสม

โครงการการเรียนรู้ของเครื่องโอเพนซอร์สของ Google

9. คาลิบัน

Caliban เป็นเครื่องมือที่ออกแบบมาสำหรับการพัฒนาเวิร์กโฟลว์การวิจัย ML และโน้ตบุ๊กในสภาพแวดล้อม Docker ที่แยกออกมาและทำซ้ำได้ ส่วนที่ดีที่สุด – คุณไม่จำเป็นต้องเรียนรู้ความซับซ้อนของ Docker เพื่อใช้ Caliban! ด้วย Caliban คุณสามารถสร้างและเรียกใช้โมเดล ML บนเครื่องของคุณ และส่งรหัสในเครื่องไปยังระบบคลาวด์ได้ เครื่องมือนี้เหมาะสำหรับเวิร์กโฟลว์ ML บน Pytorch, Tensorflow และ JAX

10. บูดู

Budou เป็นเครื่องมือแบ่งบรรทัดอัตโนมัติที่ออกแบบมาสำหรับภาษา CJK (จีน ญี่ปุ่น และเกาหลี) โดยจะแปลข้อความ CJK เป็นโค้ด HTML ที่จัดระเบียบโดยอัตโนมัติ ส่งผลให้มีรูปแบบตัวอักษรที่สวยงาม Budou แบ่งส่วนหัวและประโยคออกเป็นชิ้นๆ ที่มีความหมายหลายบรรทัดตามความกว้างหน้าจอของเบราว์เซอร์

11. สาเหตุผลกระทบ

โปรเจ็กต์ Google นี้เป็นคลังสถิติที่ประเมินผลกระทบเชิงสาเหตุของการแทรกแซงต่อแบบจำลองอนุกรมเวลา แพ็คเกจ CausalImpact R ใช้อนุกรมเวลาแบบ Bayesian ที่มีโครงสร้างเพื่อกำหนดว่าตัววัดการตอบสนองจะพัฒนาไปอย่างไรหลังจากการแทรกแซง หากไม่ได้เกิดขึ้นตั้งแต่แรก ตัวอย่างเช่น มันค่อนข้างท้าทายที่จะตอบคำถามเช่น "แคมเปญการตลาดเฉพาะสร้างคลิกใหม่ได้กี่ครั้ง" โดยไม่ต้องใช้การทดลองแบบสุ่ม CausalImpact สามารถช่วยค้นหาคำตอบสำหรับคำถามดังกล่าว

12. DeepMind Lab

DeepMind Lab เป็นแพลตฟอร์มเกม 3D คนแรกที่ปรับแต่งได้อย่างเต็มที่สำหรับการวิจัยและพัฒนาระบบปัญญาประดิษฐ์และระบบการเรียนรู้ของเครื่อง ประกอบด้วยปริศนาที่ท้าทายและภารกิจการนำทางที่สำคัญในการเรียนรู้การเสริมแรงอย่างลึกซึ้ง DeepMind Lab มี API ที่เรียบร้อยและยืดหยุ่นซึ่งช่วยให้คุณสร้างการออกแบบงานที่เป็นนวัตกรรมและการออกแบบ AI ที่ไม่เหมือนใครซึ่งสามารถทำซ้ำได้ทันที DeepMind ของ Google ใช้ DeepMind Lab อย่างกว้างขวางในการวิจัยและฝึกอบรมตัวแทนการเรียนรู้ AI/ML

13. DeepVariant

DeepVariant เป็นไปป์ไลน์การวิเคราะห์ที่ใช้ประโยชน์จากโครงข่ายประสาทเทียมเพื่อค้นหาตัวแปรทางพันธุกรรมจากข้อมูลการจัดลำดับ DNA รุ่นต่อไป ใช้ ไลบรารี Nucleus (ประกอบด้วยโค้ด Python และ C++) เพื่ออ่านและเขียนข้อมูลในรูปแบบไฟล์จีโนมทั่วไปที่ผสานรวมกับ TensorFlow ได้อย่างราบรื่น

14. โดปามีน

เป็นกรอบการวิจัยที่ใช้ TensorFlow ที่สร้างขึ้นสำหรับการสร้างต้นแบบอย่างรวดเร็วของอัลกอริธึมการเรียนรู้การเสริมแรง โดปามีนได้รับการออกแบบให้เป็นฐานโค้ดขนาดเล็กและใช้งานง่าย ซึ่งช่วยให้ผู้ใช้สามารถทดลองกับแนวคิดที่ต่างไปจากเดิมอย่างสิ้นเชิงและการวิจัยเชิงเก็งกำไร มีหลักการออกแบบหลักสี่ประการ:

  • ทดลองง่าย
  • การพัฒนาที่ยืดหยุ่น
  • การใช้งานที่กะทัดรัดและเชื่อถือได้
  • ผลลัพธ์ที่ทำซ้ำได้

15. โกลด์ฟินช์

Goldfinch เป็นชุดข้อมูลที่สร้างขึ้นเพื่อแก้ปัญหาการจดจำที่ละเอียด ประกอบด้วยคอลเล็กชันหมวดหมู่ต่างๆ เช่น นก ผีเสื้อ สุนัข เครื่องบิน และหมวดหมู่อื่นๆ พร้อมกับ URL การค้นหา Flickr ที่เกี่ยวข้องและการค้นหารูปภาพของ Google หมวดหมู่สุนัขประกอบด้วยคำอธิบายประกอบการเรียนรู้เชิงรุกจำนวนมาก Google ใช้ Goldfinch เพื่อสำรวจ Computer Vision และเทคนิคการเรียนรู้ของเครื่องสำหรับปัญหาการจดจำที่ละเอียด

16. คิวบ์โฟลว์

Kubeflow เป็นชุดเครื่องมือ ML ที่ออกแบบมาเฉพาะสำหรับ Kubernetes ทำให้การปรับใช้เวิร์กโฟลว์การเรียนรู้ของเครื่อง (ML) บน Kubernetes แบบพกพาและปรับขนาดได้ จุดมุ่งหมายหลักคือการเสนอวิธีง่ายๆ ในการปรับใช้ OS ที่ดีที่สุดในระดับเดียวกันสำหรับ ML กับโครงสร้างพื้นฐานที่หลากหลายและหลากหลาย คุณสามารถเรียกใช้ Kubeflow บนระบบหรือสภาพแวดล้อมที่ใช้งาน Kubernetes ได้

17. สีม่วงแดง

เป็นโครงการวิจัยที่พัฒนาขึ้นเพื่อสำรวจว่า Machine Learning ในการสร้างสรรค์ดนตรีและศิลปะอย่างไร เป้าหมายหลักของโครงการนี้คือการสร้างอัลกอริธึมการเรียนรู้เชิงลึกและเสริมการเรียนรู้เพื่อผลิตเพลง รูปภาพ ภาพวาด และเนื้อหาที่สร้างสรรค์อื่นๆ เป็นความพยายามที่จะสร้างเครื่องมืออัจฉริยะที่ช่วยเพิ่มความสามารถและศักยภาพของศิลปินและนักดนตรี

บทสรุป

เพื่อสรุป คำแนะนำสุดท้ายของเราคือดำเนินการโครงการเหล่านี้และแยกส่วนเพื่อทำความเข้าใจความแตกต่างที่ลึกซึ้งยิ่งขึ้น สิ่งนี้จะช่วยเสริมความรู้ ML ของคุณและสอนคุณว่าเทคโนโลยี ML ทำงานแตกต่างกันอย่างไรในแต่ละโครงการ

เราหวังว่าการลงลึกใน 17 โครงการการเรียนรู้ของเครื่องโอเพนซอร์สเหล่านี้ คุณจะพบแรงบันดาลใจในการพัฒนาโครงการ Machine Learning ของคุณเอง!

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับแมชชีนเลิร์นนิง โปรดดูที่ IIIT-B & upGrad's PG Diploma in Machine Learning & AI ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมที่เข้มงวดมากกว่า 450 ชั่วโมง กรณีศึกษาและการมอบหมายมากกว่า 30 รายการ IIIT- สถานะศิษย์เก่า B, 5+ โครงการหลักที่ใช้งานได้จริง & ความช่วยเหลือด้านงานกับบริษัทชั้นนำ

ปัญหาที่เกิดขึ้นขณะใช้ AI ในการดูแลสุขภาพคืออะไร?

สาขาการแพทย์ต้องการความโปร่งใสและความสามารถในการอธิบายการตัดสินใจทางคลินิก การใช้การเรียนรู้เชิงลึกและแบบจำลอง AI อื่น ๆ ในภาคการดูแลสุขภาพนั้นมีประโยชน์อย่างมาก แต่การอธิบายแบบจำลองนั้นค่อนข้างเป็นงาน นอกจากนี้ยังมีข้อพิจารณาด้านจริยธรรมบางประการที่แอปพลิเคชันทางคลินิกของ AI ต้องเผชิญ เช่น ข้อกังวลด้านความเป็นส่วนตัวสำหรับข้อมูลที่ใช้สำหรับการฝึกอบรมแบบจำลอง AI และข้อกังวลด้านความปลอดภัยในขณะที่การนำ AI ไปใช้ในด้านการแพทย์

AI ทำให้การรักษาพยาบาลมีราคาถูกลงในแง่ของเวลาและเงินได้อย่างไร

อัลกอริธึม AI ในด้านการแพทย์มีราคาถูกกว่าวิธีการแบบเดิม ผู้คนไม่จำเป็นต้องผ่านการทดสอบในห้องปฏิบัติการที่มีราคาแพงอีกต่อไป เนื่องจากการใช้เทคโนโลยี AI ในระบบการดูแลสุขภาพ สิ่งนี้สามารถเห็นได้จากศักยภาพของ AI ในการระบุไบโอมาร์คเกอร์ที่สามารถตรวจจับความผิดปกติบางอย่างในร่างกายมนุษย์ได้ อัลกอริธึมช่วยให้มั่นใจได้ว่าแรงงานส่วนใหญ่ในการระบุไบโอมาร์คเกอร์เหล่านี้อาจเป็นแบบอัตโนมัติ ในลักษณะนี้จะช่วยประหยัดเวลาซึ่งเป็นสิ่งสำคัญมากในด้านนี้

การใช้ AI ให้พลังแก่ผู้ป่วยอย่างไร?

เทคโนโลยีที่สวมใส่ได้ เช่น นาฬิกาอัจฉริยะ กำลังถูกใช้โดยบุคคลจำนวนมากทั่วโลกเพื่อเก็บข้อมูลสุขภาพประจำวันตั้งแต่รูปแบบการนอนไปจนถึงอัตราการเต้นของหัวใจ เมื่อข้อมูลนี้รวมกับการเรียนรู้ของเครื่อง อาจเป็นไปได้ที่จะแจ้งให้บุคคลทราบสำเร็จว่าพวกเขามีความเสี่ยงต่อโรคบางชนิดนานก่อนที่ความเสี่ยงจะรุนแรงหรือไม่สามารถรักษาได้ ในปัจจุบัน แอปพลิเคชั่นมือถือให้ข้อมูลโปรไฟล์ผู้ป่วยในระดับที่ละเอียด ซึ่งอาจช่วยให้ผู้ป่วยที่มีภาวะเรื้อรังบางอย่างสามารถจัดการโรคของตนเองได้ดีขึ้นและช่วยให้มีชีวิตที่มีสุขภาพดีขึ้น ด้วยแนวทางนี้ AI มีศักยภาพที่จะช่วยให้เราตัดสินใจเรื่องสุขภาพที่ดีขึ้นสำหรับตัวเราเอง