Top 17 proiecte de învățare automată cu sursă deschisă [pentru cei proaspăți și cu experiență]
Publicat: 2020-12-22Inteligența artificială și învățarea automată determină a patra revoluție industrială. Afacerile de toate formele și dimensiunile din toate industriile îmbrățișează aceste tehnologii disruptive pentru a proiecta soluții inovatoare care să răspundă cerințelor clienților țintă.
În consecință, există o cerere masivă de profesioniști talentați, care sunt bine versați în nuanțele AI și ML. De fapt, companiile sunt gata să plătească un dolar de top candidaților merituoși cu setul de abilități potrivite.
Având în vedere cererea în creștere pentru abilități AI și ML, este de ajutor dacă aveți câteva proiecte din lumea reală sub control. Când lucrați la proiecte, le arată potențialilor angajatori că aveți dorința și cunoștințele necesare pentru a vă folosi aceste tehnologii.
Dacă sunteți în căutarea unor proiecte inspirate de învățare automată open-source, ați dat peste locul potrivit!
Cuprins
Proiecte de învățare automată open-source
Proiecte GitHub open-source de învățare automată
1. DeOldify
DeOldify este un model de învățare profundă conceput pentru a colora și a restaura imaginile vechi. Puteți colora fotografii vechi și filmări cu DeOldify, care face o treabă fantastică de a le insufla viață! A fost modernizat pentru a oferi retuşuri mai detaliate şi mai realiste imaginilor în tonuri de gri. În plus, rezultatele arată considerabil mai puțină părtinire albastră, cu erori minime.

2. Recunoașterea facială
Această aplicație se laudă că este „cel mai simplu API de recunoaștere facială din lume pentru Python și linia de comandă”. Poate recunoaște și manipula fețe din Python sau din linia de comandă folosind software-ul de ultimă generație de recunoaștere a feței de la dlib. Acest model de învățare profundă susține că are o rată de acuratețe de 99,38% conform benchmark -ului LFW . Puteți folosi instrumentul de linie de comandă „face_recognition” pentru a efectua recunoașterea feței pe un folder de imagini din linia de comandă!
3. Clonarea vocii
Acest proiect ML este o implementare a transferului de învățare de la verificarea vorbitorului la sinteza text-la-vorbire cu mai multe vorbitoare (SV2TTS). SV2TTS este un instrument de învățare profundă care poate genera o reprezentare numerică a unei voci din orice clip audio și poate antrena un model text-to-vorbire pentru a se generaliza la noi voci. Această aplicație poate clona orice voce în 5 secunde și poate produce un discurs arbitrar, totul în timp real!
4. NeuralTalk2
NeuralTalk2 este în esență un cod de captare a imaginii scris în Lua. Funcționează pe GPU și necesită Torch. NeuralTalk2 poate subtitra imagini/videoclipuri cu propoziții utilizând rețeaua neuronală recurentă multimodală. Acesta este un instrument ideal pentru creatorii de conținut în rețelele sociale – puteți genera subtitrări pentru imaginile/videoclipurile dvs. și puteți folosi acest model și pentru a crea conținut amuzant de imagini/video (cele cu subtitrări amuzante).
Citiți: Carieră în învățare automată
5. U-GAT-IT
U-GAT-IT (Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation) este un proiect ML cu un accent simplu – pentru a traduce imaginea unei persoane în avatarul său anime. Acest model poate converti imagini care necesită modificări holistice și imagini care necesită variații mari de formă, utilizând o nouă tehnică de traducere imagine-la-imagine nesupravegheată. Inutil să spun că acesta este proiectul perfect pentru iubitorii de anime!
6. Srez
Srez folosește învățarea profundă pentru super-rezoluția imaginii – poate mări imagini de 16×16 de patru ori rezoluția lor pentru a genera fotografii de 64×64. Rezultatele descriu caracteristici clare și distincte care par suficient de lăudabile în comparație cu setul de date de antrenament. Arhitectura de bază include un DCGAN care acceptă intrările de imagine 16×16 în rețeaua generatorului în loc de distribuția gaussiană multinomială.
7. AVA
AVA este un cadru care își propune să ofere analize vizuale automatizate și bazate pe inteligență artificială. Primul „A” din AVA are conotații multiple – este un cadru Alibaba care se străduiește să devină o „soluție automată, bazată pe inteligență artificială, care acceptă analiza sporită”. AVA include trei pachete, și anume, CKB (spațiu de stocare pentru cunoștințe empirice pentru vizualizare/diagrame), DataWizard (biblioteca de procesare a datelor) și ChartAdvisor (componenta de bază care sugerează diagrame în funcție de setul de date și cerințele de analiză).
8. Megatron
Dezvoltat de echipa Applied Deep Learning Research de la NVIDIA, Megatron este un transformator puternic care poate antrena modele de limbaje voluminoase pentru a-și îmbunătăți performanța pe măsură ce se extind. Este un proiect în curs de desfășurare care sprijină antrenamentul cu mai multe noduri în paralel cu modelul BERT și GPT2 prin precizie mixtă.
Proiecte de învățare automată Google open-source
9. Caliban
Caliban este un instrument conceput pentru dezvoltarea fluxurilor de lucru și a notebook-urilor de cercetare ML în medii Docker izolate și reproductibile. Cea mai bună parte – nici măcar nu trebuie să înveți complexitățile Docker pentru a folosi Caliban! Cu Caliban, puteți construi și rula modele ML pe mașina dvs. și, de asemenea, puteți trimite codul local în cloud. Acest instrument este perfect pentru fluxurile de lucru ML pe Pytorch, Tensorflow și JAX.

10. Budou
Budou este un instrument automat de rupere a liniilor conceput pentru limbile CJK (chineză, japoneză și coreeană). Traduce automat textul CJK în cod HTML organizat, rezultând o tipografie frumoasă. Budou fragmentează titlurile și propozițiile în mai multe rânduri de bucăți semnificative pe lățimea ecranului browserului.
11. Impact cauzal
Acest proiect Google este o bibliotecă de statistici care estimează efectul cauzal al unei intervenții asupra unui model de serie de timp. Pachetul CausalImpact R folosește o serie de timp bayesiană structurală pentru a determina modul în care metrica răspunsului evoluează după intervenție dacă aceasta nu ar fi avut loc în primul rând. De exemplu, este destul de dificil să răspunzi la o întrebare precum „câte clicuri noi a generat o anumită campanie de marketing?” fără a utiliza un experiment randomizat. CausalImpact vă poate ajuta să găsiți răspunsuri la astfel de întrebări.
12. DeepMind Lab
DeepMind Lab este o platformă de joc 3D complet personalizabilă, la persoana întâi, pentru cercetarea și dezvoltarea sistemelor de inteligență artificială și de învățare automată. Constă dintr-o serie de puzzle-uri provocatoare și sarcini de navigare, care sunt esențiale în învățarea de întărire profundă. DeepMind Lab are un API ordonat și flexibil care vă permite să creați design-uri inovatoare de sarcini și design-uri unice AI care pot fi repetate cu promptitudine. DeepMind de la Google folosește DeepMind Lab pe scară largă pentru a cerceta și a instrui agenți de învățare AI/ML.
13. DeepVariant
DeepVariant este o conductă de analiză care folosește o rețea neuronală pentru a găsi variante genetice din datele de secvențiere a ADN-ului de generație următoare. Utilizează biblioteca Nucleus (conținând cod Python și C++) pentru a citi și scrie date în formate comune de fișiere genomice care se integrează perfect cu TensorFlow.
14. Dopamina
Este un cadru de cercetare bazat pe TensorFlow, creat pentru prototiparea rapidă a algoritmilor de învățare prin consolidare. Dopamina a fost concepută ca o bază de cod mică și intuitivă, care permite utilizatorilor să experimenteze idei radicale și cercetări speculative. Are patru principii de bază de proiectare:
- Experimentare ușoară
- Dezvoltare flexibilă
- Implementare compactă și fiabilă
- Rezultate reproductibile
15. Goldfinch
Goldfinch este un set de date creat pentru a rezolva provocările detaliate de recunoaștere. Include o colecție de categorii diferite - pasăre, fluture, câine, avioane și alte categorii, împreună cu adrese URL relevante de căutare Flickr și căutări de imagini Google. Categoria câini include numeroase adnotări de învățare activă. Google folosește Goldfinch pentru a explora tehnicile de computer Vision și Machine Learning pentru probleme de recunoaștere fină.

16. Kubeflow
Kubeflow este un set de instrumente ML conceput exclusiv pentru Kubernetes. Face implementarea fluxurilor de lucru de învățare automată (ML) pe Kubernetes portabilă și scalabilă. Scopul principal este de a oferi o modalitate simplă de a implementa cel mai bun sistem de operare din clasă pentru ML în infrastructuri multiple și variate. Puteți rula Kubeflow pe orice sistem sau mediu care rulează Kubernetes.
17. Magenta
Acesta este un proiect de cercetare dezvoltat pentru a explora modul în care Machine Learning în crearea muzicii și a artei. Obiectivul principal al acestui proiect este de a construi algoritmi de învățare profundă și de întărire pentru a produce melodii, imagini, desene și alt conținut creativ. Este o încercare de a crea instrumente inteligente care sporesc abilitățile și potențialul artiștilor și muzicienilor.
Concluzie
Pentru a încheia, sfatul nostru final ar fi să trecem prin aceste proiecte și să le dezintegram pentru a înțelege nuanțele mai profunde. Acest lucru vă va ajuta să vă îmbogățiți cunoștințele ML și vă va învăța cum funcționează diferit tehnologiile ML în fiecare proiect.
Sperăm că, scufundându-vă mai adânc în aceste 17 proiecte open-source de Machine Learning, veți găsi inspirația pentru a vă dezvolta propriul proiect de Machine Learning!
Dacă sunteți interesat să aflați mai multe despre învățarea automată, consultați Diploma PG de la IIIT-B și upGrad în Învățare automată și AI, care este concepută pentru profesioniști care lucrează și oferă peste 450 de ore de pregătire riguroasă, peste 30 de studii de caz și sarcini, IIIT- B Statut de absolvenți, peste 5 proiecte practice practice și asistență pentru locuri de muncă cu firme de top.
Care sunt problemele care apar la utilizarea AI în asistența medicală?
Domeniul medicinei necesită transparență și capacitatea de a descrie deciziile clinice. Utilizarea învățării profunde și a altor modele AI în sectorul sănătății este extrem de benefică, dar explicarea modelelor este o sarcină destul de mare. Există, de asemenea, anumite considerente etice cu care se confruntă aplicațiile clinice AI, cum ar fi preocupările privind confidențialitatea datelor utilizate pentru formarea modelelor AI și preocupările de securitate în timpul implementării AI în domeniul medical.
Cum face AI să fie asistența medicală mai puțin costisitoare în termeni de timp și bani?
Algoritmii AI din domeniul medicinei sunt mai puțin costisitoare decât abordările tradiționale. Oamenii nu mai trebuie să treacă printr-o serie de teste de laborator costisitoare datorită utilizării tehnologiei AI în sistemul de sănătate. Acest lucru se poate observa în potențialul AI în identificarea biomarkerilor capabili să detecteze anumite tulburări în corpul uman. Algoritmii asigură că majoritatea muncii manuale în specificarea acestor biomarkeri poate fi automatizată. În acest fel, economisesc timp, ceea ce este foarte important în acest domeniu.
Cum folosirea inteligenței artificiale dă putere pacienților?
Tehnologia purtabilă, cum ar fi ceasurile inteligente, este deja utilizată de un număr mare de persoane din întreaga lume pentru a capta date zilnice de sănătate, de la tiparele de somn la ritmul cardiac. Atunci când aceste date sunt combinate cu învățarea automată, poate fi posibil să se informeze cu succes persoanele dacă sunt expuse riscului anumitor boli cu mult înainte ca riscul să devină sever sau netratabil. În prezent, aplicațiile mobile oferă informații detaliate despre profilul pacientului, care pot ajuta pacienții care trăiesc cu anumite afecțiuni cronice să își gestioneze mai bine boala și, prin urmare, să trăiască o viață mai sănătoasă. Cu această abordare, AI are potențialul de a ne împuternici să luăm decizii mai bune în materie de sănătate pentru noi înșine.