أهم 17 مشروعًا مفتوح المصدر لتعلم الآلة [للمستجدين وذوي الخبرة]
نشرت: 2020-12-22يُحدث الذكاء الاصطناعي والتعلم الآلي الثورة الصناعية الرابعة. تتبنى الشركات من جميع الأشكال والأحجام في جميع الصناعات هذه التقنيات التخريبية لتصميم حلول مبتكرة تلبي متطلبات عملائها المستهدفين.
وبالتالي ، هناك طلب هائل على المهنيين الموهوبين الذين لديهم دراية جيدة بالفروق الدقيقة في الذكاء الاصطناعي والتعلم الآلي. في الواقع ، الشركات على استعداد لدفع أعلى دولارات للمرشحين المستحقين الذين يتمتعون بمجموعة المهارات المناسبة.
في ضوء الطلب المتزايد على مهارات الذكاء الاصطناعي والتعلم الآلي ، من المفيد أن يكون لديك عدد قليل من المشاريع الواقعية تحت حزامك. عندما تعمل في مشاريع ، فهذا يُظهر لأصحاب العمل المحتملين أن لديك الدافع والمعرفة للحصول على هذه التقنيات.
إذا كنت تبحث عن مشروعات ملهمة للتعلم الآلي مفتوحة المصدر ، فقد عثرت على المكان الصحيح!
جدول المحتويات
مشاريع تعلم الآلة مفتوحة المصدر
مشاريع التعلم الآلي مفتوحة المصدر من GitHub
1. DeOldify
DeOldify هو نموذج تعليمي عميق مصمم لتلوين الصور القديمة واستعادتها. يمكنك تلوين الصور القديمة ولقطات الأفلام باستخدام DeOldify الذي يقوم بعمل رائع في غرس الحياة فيها! وقد تمت ترقيته لتقديم لمسات أكثر تفصيلاً وواقعية للصور الرمادية. بالإضافة إلى ذلك ، تظهر النتائج انحيازًا أزرق أقل بشكل ملحوظ مع أقل قدر من الثغرات.

2. التعرف على الوجه
يفتخر هذا التطبيق بأنه "أبسط واجهة برمجة تطبيقات للتعرف على الوجه في العالم لبايثون وسطر الأوامر." يمكنه التعرف على الوجوه ومعالجتها من Python أو سطر الأوامر باستخدام أحدث برامج التعرف على الوجوه من dlib. يدعي نموذج التعلم العميق هذا أنه يحتوي على معدل دقة بنسبة 99.38 ٪ لكل معيار LFW . يمكنك استخدام أداة سطر الأوامر "face_recognition" لإجراء التعرف على الوجوه في مجلد صورة من سطر الأوامر!
3. استنساخ الصوت
يعد مشروع ML هذا بمثابة تنفيذ لنقل التعلم من التحقق من المتحدث إلى توليف تحويل النص إلى كلام متعدد الوسائط (SV2TTS). SV2TTS هي أداة تعليمية عميقة يمكنها إنشاء تمثيل رقمي للصوت من أي مقطع صوتي وتدريب نموذج تحويل النص إلى كلام للتعميم على الأصوات الجديدة. يمكن لهذا التطبيق استنساخ أي صوت في 5 ثوانٍ وإنتاج كلام عشوائي ، كل ذلك في الوقت الفعلي!
4. NeuralTalk2
NeuralTalk2 هو في الأساس رمز لالتقاط الصور مكتوب بلغة Lua. يعمل على GPU ويتطلب Torch. يمكن لـ NeuralTalk2 تسمية الصور / مقاطع الفيديو بجمل من خلال الاستفادة من الشبكة العصبية المتكررة متعددة الوسائط. هذه أداة مثالية لمنشئي محتوى الوسائط الاجتماعية - يمكنك إنشاء ترجمات مصاحبة للصور / مقاطع الفيديو الخاصة بك ، ويمكنك أيضًا استخدام هذا النموذج لإنشاء محتوى مضحكة للصور / الفيديو (تلك التي تحتوي على ترجمات مضحكة).
قراءة: مهنة في تعلم الآلة
5. U-GAT-IT
U-GAT-IT (شبكات الانتباه التوليدية غير الخاضعة للإشراف مع تطبيع مثيل الطبقة التكيفية لترجمة الصورة إلى الصورة) هو مشروع ML مع تركيز بسيط - لترجمة صورة الشخص إلى الصورة الرمزية الخاصة به. يمكن لهذا النموذج تحويل الصور التي تتطلب تغييرات شاملة وصورًا تتطلب اختلافات كبيرة في الشكل من خلال الاستفادة من تقنية ترجمة جديدة غير خاضعة للرقابة من صورة إلى صورة. وغني عن القول ، هذا هو المشروع المثالي لمحبي الرسوم المتحركة!
6. Srez
يستخدم Srez التعلم العميق للحصول على دقة فائقة للصور - يمكنه رفع مستوى دقة الصور 16 × 16 أربع مرات لتوليد 64 × 64 صورة. تظهر النتائج ميزات حادة ومميزة تبدو جديرة بالثناء بدرجة كافية مقارنة بمجموعة بيانات التدريب. تتضمن البنية الأساسية DCGAN الذي يقبل مدخلات الصورة 16 × 16 إلى شبكة المولد بدلاً من التوزيع الغاوسي متعدد الحدود.
7. AVA
AVA هو إطار عمل يهدف إلى تقديم تحليلات مرئية مؤتمتة ومدعومة بالذكاء الاصطناعي. أول حرف "أ" في AVA له دلالات متعددة - إنه إطار عمل Alibaba الذي يسعى جاهداً ليصبح "حلًا آليًا يحركه الذكاء الاصطناعي ويدعم التحليلات المعززة." تتضمن AVA ثلاث حزم ، وهي CKB (مساحة تخزين للمعرفة التجريبية للتصور / الرسوم البيانية) ، و DataWizard (مكتبة معالجة البيانات) ، و ChartAdvisor (المكون الأساسي الذي يقترح المخططات وفقًا لمتطلبات مجموعة البيانات والتحليل).
8. ميجاترون
تم تطوير Megatron بواسطة فريق أبحاث التعلم العميق التطبيقي في NVIDIA ، وهو عبارة عن محول قوي يمكنه تدريب نماذج لغة ضخمة لتحسين أدائها أثناء توسيع نطاقها. إنه مشروع مستمر يدعم التدريب المتوازي للنموذج متعدد العقد لـ BERT و GPT2 عبر دقة مختلطة.
مشاريع التعلم الآلي مفتوحة المصدر من Google

9. كاليبان
Caliban هي أداة مصممة لتطوير سير عمل أبحاث ML ودفاتر الملاحظات في بيئات Docker المعزولة والقابلة للتكرار. أفضل جزء - لست بحاجة حتى إلى تعلم تعقيدات Docker لاستخدام Caliban! باستخدام Caliban ، يمكنك إنشاء نماذج ML وتشغيلها على جهازك وأيضًا شحن الكود المحلي إلى السحابة. هذه الأداة مثالية لسير عمل ML على Pytorch و Tensorflow و JAX.
10. بودو
Budou هي أداة تلقائية لكسر الأسطر مصممة للغات CJK (الصينية واليابانية والكورية). يقوم تلقائيًا بترجمة نص CJK إلى كود HTML منظم ، مما ينتج عنه طباعة جميلة. يُجزئ Budou العناوين والجمل إلى سطور متعددة من الأجزاء ذات المعنى في عرض شاشة المتصفح.
11. التأثير السببي
مشروع Google هذا عبارة عن مكتبة إحصائية تقدر التأثير السببي للتدخل على نموذج السلاسل الزمنية. تستخدم حزمة CausalImpact R سلسلة زمنية هيكلية Bayesian لتحديد كيفية تطور مقياس الاستجابة بعد التدخل إذا لم يحدث في المقام الأول. على سبيل المثال ، من الصعب جدًا الإجابة على سؤال مثل "كم عدد النقرات الجديدة التي حققتها حملة تسويقية معينة؟" بدون استخدام تجربة عشوائية. يمكن أن يساعد CausalImpact في العثور على إجابات لمثل هذه الأسئلة.
12. مختبر DeepMind
DeepMind Lab عبارة عن منصة ألعاب ثلاثية الأبعاد قابلة للتخصيص بالكامل من منظور الشخص الأول للبحث والتطوير في أنظمة الذكاء الاصطناعي والتعلم الآلي. وهو يتألف من مجموعة من الألغاز الصعبة ومهام التنقل التي تعتبر محورية في التعلم المعزز العميق. يحتوي DeepMind Lab على واجهة برمجة تطبيقات أنيقة ومرنة تتيح لك إنشاء تصميمات مهام مبتكرة وتصميمات فريدة للذكاء الاصطناعي يمكن تكرارها على الفور. يستخدم DeepMind من Google DeepMind Lab على نطاق واسع للبحث وتدريب وكلاء التعلم AI / ML.
13. DeepVariant
DeepVariant هو خط أنابيب تحليل يستفيد من الشبكة العصبية للعثور على المتغيرات الجينية من بيانات تسلسل الحمض النووي من الجيل التالي. يستخدم مكتبة Nucleus (التي تحتوي على كود Python و C ++) لقراءة وكتابة البيانات بتنسيقات ملفات الجينوم الشائعة التي تتكامل بسلاسة مع TensorFlow.
14. الدوبامين
إنه إطار بحثي قائم على TensorFlow مصمم للنماذج الأولية السريعة لخوارزميات التعلم المعزز. تم تصميم الدوبامين كقاعدة بيانات صغيرة وبديهية تمكن المستخدمين من تجربة الأفكار الراديكالية والبحث التأملي. لديها أربعة مبادئ تصميم أساسية:
- سهولة التجريب
- تطوير مرن
- تنفيذ مدمج وموثوق
- نتائج قابلة للتكرار
15. طائر الحسون
الحسون الذهبي عبارة عن مجموعة بيانات تم إنشاؤها لحل تحديات التعرف الدقيقة. يتضمن مجموعة من الفئات المختلفة - الطيور ، والفراشات ، والكلاب ، والطائرات ، وفئات أخرى إلى جانب عناوين URL ذات الصلة لبحث Flickr وعمليات البحث عن الصور في Google. تتضمن فئة الكلاب العديد من التعليقات التوضيحية للتعلم النشط. تستخدم Google طائر الحسون لاستكشاف تقنيات الرؤية الحاسوبية والتعلم الآلي لمشاكل التعرف الدقيقة.

16. كوبفلو
Kubeflow عبارة عن مجموعة أدوات ML مصممة خصيصًا لـ Kubernetes. يجعل نشر مهام سير عمل التعلم الآلي (ML) على Kubernetes محمولة وقابلة للتطوير. الهدف الرئيسي هو تقديم طريقة بسيطة لنشر نظام التشغيل الأفضل في فئته لـ ML إلى بنى تحتية متعددة ومتنوعة. يمكنك تشغيل Kubeflow على أي نظام أو بيئة تقوم بتشغيل Kubernetes.
17. أرجواني
هذا مشروع بحثي تم تطويره لاستكشاف كيفية تعلم الآلة في إنشاء الموسيقى والفن. ينصب التركيز الأساسي لهذا المشروع على بناء خوارزميات التعلم العميق والتعلم المعزز لإنتاج الأغاني والصور والرسومات والمحتويات الإبداعية الأخرى. إنها محاولة لإنشاء أدوات ذكية تعزز قدرات وإمكانات الفنانين والموسيقيين.
خاتمة
في الختام ، ستكون نصيحتنا الأخيرة هي متابعة هذه المشاريع وتفكيكها لفهم الفروق الدقيقة. سيساعد هذا في إثراء معرفتك بـ ML ويعلمك كيف تعمل تقنيات ML بشكل مختلف في كل مشروع.
نأمل أن تجد مصدر إلهام لتطوير مشروع التعلم الآلي الخاص بك من خلال التعمق أكثر في مشاريع التعلم الآلي السبعة عشر مفتوحة المصدر هذه!
إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي ، فراجع دبلوم PG في IIIT-B & upGrad في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، IIIT- حالة الخريجين B ، أكثر من 5 مشاريع تتويجا عملية ومساعدة وظيفية مع أفضل الشركات.
ما هي المشاكل التي تحدث أثناء استخدام الذكاء الاصطناعي في الرعاية الصحية؟
يتطلب مجال الطب الشفافية والقدرة على وصف القرارات السريرية. يعد استخدام التعلم العميق ونماذج الذكاء الاصطناعي الأخرى في قطاع الرعاية الصحية مفيدًا للغاية ولكن شرح النماذج يعد مهمة كبيرة. هناك أيضًا بعض الاعتبارات الأخلاقية التي تواجهها التطبيقات السريرية للذكاء الاصطناعي ، مثل مخاوف الخصوصية للبيانات المستخدمة في تدريب نموذج الذكاء الاصطناعي والمخاوف الأمنية أثناء تنفيذ الذكاء الاصطناعي في المجال الطبي.
كيف يجعل الذكاء الاصطناعي الرعاية الصحية أقل تكلفة من حيث الوقت والمال؟
تعد خوارزميات الذكاء الاصطناعي في مجال الطب أقل تكلفة من الأساليب التقليدية. لم يعد الناس بحاجة إلى الخضوع لعدد كبير من الاختبارات المعملية المكلفة بسبب استخدام تقنية الذكاء الاصطناعي في نظام الرعاية الصحية. يمكن ملاحظة ذلك في قدرة الذكاء الاصطناعي على تحديد المؤشرات الحيوية القادرة على اكتشاف اضطرابات معينة في جسم الإنسان. تضمن الخوارزميات أن غالبية العمل اليدوي في تحديد هذه المؤشرات الحيوية قد يكون آليًا. بهذه الطريقة ، فإنها توفر الوقت وهو أمر بالغ الأهمية في هذا المجال.
كيف يؤدي استخدام الذكاء الاصطناعي إلى تمكين المرضى؟
يتم بالفعل استخدام التكنولوجيا القابلة للارتداء ، مثل الساعات الذكية ، من قبل عدد كبير من الأفراد في جميع أنحاء العالم لالتقاط البيانات الصحية اليومية التي تتراوح من أنماط النوم إلى معدل ضربات القلب. عندما يتم دمج هذه البيانات مع التعلم الآلي ، قد يكون من الممكن إبلاغ الأفراد بنجاح ما إذا كانوا معرضين لخطر الإصابة بأمراض معينة قبل وقت طويل من أن يصبح الخطر شديدًا أو غير قابل للعلاج. في الوقت الحالي ، توفر تطبيقات الأجهزة المحمولة معلومات ملف تعريف المريض على مستوى حبيبي ، والتي قد تساعد المرضى الذين يعانون من حالات مزمنة معينة على إدارة مرضهم بشكل أفضل وبالتالي عيش حياة أكثر صحة. مع هذا النهج ، يتمتع الذكاء الاصطناعي بالقدرة على تمكيننا من اتخاذ قرارات صحية أفضل لأنفسنا.