Top 17 des projets d'apprentissage automatique open source [Pour les débutants et les expérimentés]

Publié: 2020-12-22

L'intelligence artificielle et l'apprentissage automatique sont à l'origine de la quatrième révolution industrielle. Des entreprises de toutes formes et de toutes tailles dans tous les secteurs adoptent ces technologies perturbatrices pour concevoir des solutions innovantes répondant aux demandes de leurs clients cibles.

Par conséquent, il existe une demande massive de professionnels talentueux qui connaissent bien les nuances de l'IA et du ML. En fait, les entreprises sont prêtes à payer le gros prix à des candidats méritants possédant les bonnes compétences.

À la lumière de la demande croissante de compétences en IA et en ML, cela aide si vous avez quelques projets réels à votre actif. Lorsque vous travaillez sur des projets, cela montre aux employeurs potentiels que vous avez la volonté et les connaissances nécessaires pour vous familiariser avec ces technologies.

Si vous êtes à la recherche de projets d'apprentissage automatique open source inspirants, vous êtes tombé sur le bon endroit !

Table des matières

Projets d'apprentissage automatique open source

Projets d'apprentissage automatique open source GitHub

1. Désoldifier

DeOldify est un modèle d'apprentissage en profondeur conçu pour coloriser et restaurer d'anciennes images. Vous pouvez coloriser de vieilles photos et séquences de films avec DeOldify qui fait un travail fantastique pour leur insuffler de la vie ! Il a été amélioré pour offrir des retouches plus détaillées et réalistes aux images en niveaux de gris. De plus, les résultats montrent considérablement moins de biais bleu avec un minimum de pépins.

2. Reconnaissance faciale

Cette application se vante d'être "l'API de reconnaissance faciale la plus simple au monde pour Python et la ligne de commande". Il peut reconnaître et manipuler les visages à partir de Python ou de la ligne de commande à l'aide du logiciel de reconnaissance faciale de pointe de dlib. Ce modèle d'apprentissage en profondeur prétend avoir un taux de précision de 99,38 % selon la référence LFW . Vous pouvez utiliser l'outil de ligne de commande "face_recognition" pour effectuer la reconnaissance faciale sur un dossier d'images à partir de la ligne de commande !

3. Clonage de la voix

Ce projet ML est une implémentation de Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS). SV2TTS est un outil d'apprentissage en profondeur qui peut générer une représentation numérique d'une voix à partir de n'importe quel clip audio et entraîner un modèle de synthèse vocale à généraliser à de nouvelles voix. Cette application peut cloner n'importe quelle voix en 5 secondes et produire un discours arbitraire, le tout en temps réel !

4. NeuralTalk2

NeuralTalk2 est essentiellement un code de capture d'image écrit en Lua. Il fonctionne sur GPU et nécessite Torch. NeuralTalk2 peut sous-titrer des images/vidéos avec des phrases en tirant parti du réseau neuronal récurrent multimodal. C'est un outil idéal pour les créateurs de contenu de médias sociaux - vous pouvez générer des sous-titres pour vos images/vidéos, et vous pouvez également utiliser ce modèle pour créer du contenu image/vidéo amusant (ceux avec des sous-titres amusants).

Lire : Carrière dans l'apprentissage automatique

5. U-GAT-IT

U-GAT-IT (Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation) est un projet ML avec un objectif simple : traduire l'image d'une personne en son avatar anime. Ce modèle peut convertir des images nécessitant des changements holistiques et des images nécessitant de grandes variations de forme en tirant parti d'une nouvelle technique de traduction d'image à image non supervisée. Inutile de dire que c'est le projet parfait pour les amateurs d'anime !

6. Srez

Srez utilise l'apprentissage en profondeur pour la super-résolution d'image - il peut mettre à l'échelle des images 16 × 16 quatre fois leur résolution pour générer des photos 64 × 64. Les résultats décrivent des caractéristiques nettes et distinguées qui semblent assez louables par rapport à l'ensemble de données de formation. L'architecture sous-jacente comprend un DCGAN qui accepte les entrées d'image 16 × 16 vers le réseau du générateur au lieu d'une distribution gaussienne multinomiale.

7. AV

AVA est un cadre qui vise à fournir des analyses visuelles automatisées et alimentées par l'IA. Le premier « A » dans AVA a plusieurs connotations : il s'agit d'un cadre Alibaba qui s'efforce de devenir une « solution automatisée, basée sur l'IA, qui prend en charge l'analyse augmentée ». AVA comprend trois packages, à savoir, CKB (espace de stockage pour les connaissances empiriques pour la visualisation/les graphiques), DataWizard (bibliothèque de traitement de données) et ChartAdvisor (le composant principal qui suggère des graphiques en fonction de l'ensemble de données et des exigences d'analyse).

8. Mégatron

Développé par l'équipe de recherche appliquée en apprentissage profond de NVIDIA, Megatron est un transformateur puissant qui peut former des modèles de langage volumineux pour améliorer leurs performances à mesure qu'ils évoluent. Il s'agit d'un projet en cours qui prend en charge la formation multi-nœud parallèle au modèle de BERT et GPT2 via une précision mixte.

Projets d'apprentissage automatique open source de Google

9. Caliban

Caliban est un outil conçu pour développer des flux de travail et des cahiers de recherche ML dans des environnements Docker isolés et reproductibles. La meilleure partie - vous n'avez même pas besoin d'apprendre les subtilités de Docker pour utiliser Caliban ! Avec Caliban, vous pouvez créer et exécuter des modèles ML sur votre machine et également expédier le code local dans le cloud. Cet outil est parfait pour les flux de travail ML sur Pytorch, Tensorflow et JAX.

10. Boudou

Budou est un outil de saut de ligne automatique conçu pour les langues CJK (chinois, japonais et coréen). Il traduit automatiquement le texte CJC en code HTML organisé, ce qui donne une belle typographie. Budou fragmente les titres et les phrases en plusieurs lignes de morceaux significatifs par la largeur de l'écran du navigateur.

11. Impact causal

Ce projet Google est une bibliothèque de statistiques qui estime l'effet causal d'une intervention sur un modèle de série chronologique. Le package CausalImpact R utilise une série chronologique bayésienne structurelle pour déterminer comment la métrique de réponse évolue après l'intervention si elle ne s'était pas produite en premier lieu. Par exemple, il est assez difficile de répondre à une question comme "combien de nouveaux clics une campagne marketing spécifique a-t-elle généré ?" sans recourir à une expérience randomisée. CausalImpact peut aider à trouver des réponses à ces questions.

12. Laboratoire DeepMind

DeepMind Lab est une plate-forme de jeu 3D à la première personne entièrement personnalisable pour la R&D des systèmes d'intelligence artificielle et d'apprentissage automatique. Il se compose d'une foule d'énigmes difficiles et de tâches de navigation qui sont essentielles à l'apprentissage par renforcement en profondeur. DeepMind Lab dispose d'une API soignée et flexible qui vous permet de créer des conceptions de tâches innovantes et des conceptions d'IA uniques qui peuvent être rapidement itérées. DeepMind de Google utilise largement DeepMind Lab pour rechercher et former des agents d'apprentissage AI/ML.

13. variante profonde

DeepVariant est un pipeline d'analyse qui exploite un réseau de neurones pour trouver des variantes génétiques à partir de données de séquençage d'ADN de nouvelle génération. Il utilise la bibliothèque Nucleus (contenant du code Python et C++) pour lire et écrire des données dans des formats de fichiers génomiques courants qui s'intègrent de manière transparente à TensorFlow.

14. Dopamine

Il s'agit d'un cadre de recherche basé sur TensorFlow conçu pour le prototypage rapide d'algorithmes d'apprentissage par renforcement. Dopamine a été conçu comme une petite base de code intuitive qui permet aux utilisateurs d'expérimenter des idées radicales et des recherches spéculatives. Il repose sur quatre principes de conception fondamentaux :

  • Expérimentation facile
  • Développement flexible
  • Mise en œuvre compacte et fiable
  • Résultats reproductibles

15. Chardonneret

Chardonneret est un ensemble de données créé pour résoudre les problèmes de reconnaissance fine. Il comprend une collection de différentes catégories - oiseaux, papillons, chiens, avions et autres catégories, ainsi que des URL de recherche Flickr et des recherches d'images Google pertinentes. La catégorie chien comprend de nombreuses annotations d'apprentissage actif. Google utilise Goldfinch pour explorer les techniques de vision par ordinateur et d'apprentissage automatique pour les problèmes de reconnaissance à grain fin.

16. Kubeflow

Kubeflow est une boîte à outils ML exclusivement conçue pour Kubernetes. Il rend le déploiement de workflows d'apprentissage automatique (ML) sur Kubernetes portable et évolutif. L'objectif principal est d'offrir un moyen simple de déployer le meilleur système d'exploitation pour ML sur des infrastructures multiples et variées. Vous pouvez exécuter Kubeflow sur n'importe quel système ou environnement exécutant Kubernetes.

17. Magenta

Il s'agit d'un projet de recherche développé pour explorer comment l'apprentissage automatique dans la création musicale et artistique. L'objectif principal de ce projet est de créer des algorithmes d'apprentissage en profondeur et d'apprentissage par renforcement pour produire des chansons, des images, des dessins et d'autres contenus créatifs. C'est une tentative de créer des outils intelligents qui améliorent les capacités et le potentiel des artistes et des musiciens.

Conclusion

Pour conclure, notre dernier conseil serait de parcourir ces projets et de les désintégrer pour comprendre les nuances les plus profondes. Cela vous aidera à enrichir vos connaissances en ML et vous apprendra comment les technologies de ML fonctionnent différemment dans chaque projet.

Nous espérons qu'en approfondissant ces 17 projets d'apprentissage automatique open source, vous trouverez l'inspiration pour développer votre propre projet d'apprentissage automatique !

Si vous souhaitez en savoir plus sur l'apprentissage automatique, consultez le diplôme PG en apprentissage automatique et IA de IIIT-B & upGrad, conçu pour les professionnels en activité et offrant plus de 450 heures de formation rigoureuse, plus de 30 études de cas et missions, IIIT- Statut B Alumni, plus de 5 projets de synthèse pratiques et aide à l'emploi avec les meilleures entreprises.

Quels sont les problèmes qui surviennent lors de l'utilisation de l'IA dans les soins de santé ?

Le domaine de la médecine exige de la transparence et la capacité de décrire les décisions cliniques. L'utilisation de l'apprentissage en profondeur et d'autres modèles d'IA dans le secteur de la santé est très bénéfique, mais expliquer les modèles est une tâche ardue. Il existe également certaines considérations éthiques auxquelles les applications cliniques de l'IA sont confrontées, telles que les problèmes de confidentialité des données utilisées pour la formation des modèles d'IA et les problèmes de sécurité lors de la mise en œuvre de l'IA dans le domaine médical.

Comment l'IA rend-elle les soins de santé moins chers en termes de temps et d'argent ?

Les algorithmes d'IA dans le domaine de la médecine sont moins coûteux que les approches traditionnelles. Les gens n'ont plus besoin de subir une multitude de tests de laboratoire coûteux grâce à l'utilisation de la technologie de l'IA dans le système de santé. Cela se voit dans le potentiel de l'IA pour identifier des biomarqueurs capables de détecter certains troubles du corps humain. Les algorithmes garantissent que la majorité du travail manuel de spécification de ces biomarqueurs peut être automatisée. De cette manière, ils gagnent du temps qui est très crucial dans ce domaine.

Comment l'utilisation de l'IA responsabilise-t-elle les patients ?

La technologie portable, telle que les montres intelligentes, est déjà utilisée par un grand nombre de personnes dans le monde pour capturer des données de santé quotidiennes allant des habitudes de sommeil à la fréquence cardiaque. Lorsque ces données sont combinées à l'apprentissage automatique, il peut être possible d'informer avec succès les individus s'ils sont à risque de certaines maladies bien avant que le risque ne devienne grave ou incurable. Actuellement, les applications mobiles fournissent des informations granulaires sur le profil des patients, ce qui peut aider les patients atteints de certaines maladies chroniques à mieux gérer leur maladie et ainsi mener une vie plus saine. Avec cette approche, l'IA a le potentiel de nous donner les moyens de prendre de meilleures décisions en matière de santé pour nous-mêmes.