17 Proyek Pembelajaran Mesin Sumber Terbuka Teratas [Untuk Freshers & Berpengalaman]

Diterbitkan: 2020-12-22

Kecerdasan Buatan dan Pembelajaran Mesin melahirkan Revolusi Industri Keempat. Bisnis dari segala bentuk dan ukuran di semua industri merangkul teknologi yang mengganggu ini untuk merancang solusi inovatif yang memenuhi tuntutan pelanggan target mereka.

Akibatnya, ada permintaan besar untuk profesional berbakat yang berpengalaman dalam nuansa AI dan ML. Faktanya, perusahaan siap membayar mahal untuk kandidat yang layak dengan keahlian yang tepat.

Mengingat meningkatnya permintaan untuk keterampilan AI dan ML, ada baiknya jika Anda memiliki beberapa proyek dunia nyata di bawah ikat pinggang Anda. Saat Anda mengerjakan proyek, ini menunjukkan kepada calon pemberi kerja bahwa Anda memiliki dorongan dan pengetahuan untuk menguasai teknologi ini.

Jika Anda mencari proyek Pembelajaran Mesin sumber terbuka yang menginspirasi, Anda telah menemukan tempat yang tepat!

Daftar isi

Proyek Pembelajaran Mesin Sumber Terbuka

Proyek Pembelajaran Mesin sumber terbuka GitHub

1. DeOldify

DeOldify adalah model pembelajaran mendalam yang dirancang untuk mewarnai dan memulihkan gambar lama. Anda dapat mewarnai foto lama dan cuplikan film dengan DeOldify yang melakukan pekerjaan luar biasa dalam menanamkan kehidupan di dalamnya! Ini telah ditingkatkan untuk memberikan sentuhan ulang yang lebih detail dan realistis pada gambar skala abu-abu. Plus, hasilnya menunjukkan bias biru yang jauh lebih sedikit dengan gangguan minimal.

2. Pengenalan wajah

Aplikasi ini membanggakan sebagai "API pengenalan wajah paling sederhana di dunia untuk Python dan baris perintah." Itu dapat mengenali dan memanipulasi wajah dari Python atau baris perintah menggunakan perangkat lunak pengenalan wajah canggih dlib. Model pembelajaran mendalam ini mengklaim memiliki tingkat akurasi 99,38% per tolok ukur LFW . Anda dapat menggunakan alat baris perintah "face_recognition" untuk melakukan pengenalan wajah pada folder gambar dari baris perintah!

3. Kloning suara

Proyek ML ini merupakan implementasi dari Transfer Learning from Speaker Verification ke Multispeaker Text-To-Speech Synthesis (SV2TTS). SV2TTS adalah alat pembelajaran mendalam yang dapat menghasilkan representasi numerik suara dari klip audio apa pun dan melatih model text-to-speech untuk digeneralisasi ke suara baru. Aplikasi ini dapat mengkloning suara apa pun dalam 5 detik dan menghasilkan ucapan sewenang-wenang, semuanya dalam waktu nyata!

4. NeuralTalk2

NeuralTalk2 pada dasarnya adalah kode pengambilan gambar yang ditulis dalam Lua. Ini berjalan pada GPU dan membutuhkan Torch. NeuralTalk2 dapat memberi keterangan gambar/video dengan kalimat dengan memanfaatkan Jaringan Saraf Berulang Multimodal. Ini adalah alat yang ideal untuk pembuat konten media sosial – Anda dapat membuat subtitle untuk gambar/video Anda, dan Anda juga dapat menggunakan model ini untuk membuat konten gambar/video lucu (yang memiliki subtitle lucu).

Baca: Karir di Machine Learning

5. U-GAT-IT

U-GAT-IT (Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation) adalah proyek ML dengan fokus sederhana – untuk menerjemahkan gambar seseorang ke dalam avatar anime mereka. Model ini dapat mengonversi gambar yang membutuhkan perubahan holistik dan gambar yang membutuhkan variasi bentuk besar dengan memanfaatkan teknik terjemahan gambar-ke-gambar baru yang tidak diawasi. Tak perlu dikatakan, ini adalah proyek yang sempurna untuk pecinta anime!

6. Srez

Srez menggunakan pembelajaran mendalam untuk resolusi super gambar – ini dapat meningkatkan gambar 16×16 empat kali resolusinya untuk menghasilkan foto 64×64. Hasilnya menggambarkan fitur yang tajam dan istimewa yang tampaknya cukup terpuji dibandingkan dengan dataset pelatihan. Arsitektur yang mendasarinya mencakup DCGAN yang menerima input gambar 16x16 ke jaringan generator alih-alih distribusi gaussian multinomial.

7. AVA

AVA adalah kerangka kerja yang bertujuan untuk menghadirkan analitik visual yang diberdayakan AI dan otomatis. "A" pertama dalam AVA memiliki banyak konotasi – ini adalah kerangka kerja Alibaba yang berusaha untuk menjadi "solusi otomatis, berbasis AI yang mendukung analitik Augmented." AVA mencakup tiga paket, yaitu, CKB (ruang penyimpanan untuk pengetahuan empiris untuk visualisasi/bagan), DataWizard (perpustakaan pemrosesan data), dan ChartAdvisor (komponen inti yang menyarankan bagan sesuai dengan kumpulan data dan persyaratan analisis).

8. Megatron

Dikembangkan oleh tim Riset Pembelajaran Mendalam Terapan NVIDIA, Megatron adalah transformator kuat yang dapat melatih model bahasa yang banyak untuk meningkatkan kinerjanya saat ditingkatkan. Ini adalah proyek berkelanjutan yang mendukung pelatihan model-paralel, multi-simpul BERT & GPT2 melalui presisi campuran.

Proyek Pembelajaran Mesin sumber terbuka Google

9. Kaliban

Caliban adalah alat yang dirancang untuk mengembangkan alur kerja dan notebook penelitian ML di lingkungan Docker yang terisolasi dan dapat direproduksi. Bagian terbaiknya – Anda bahkan tidak perlu mempelajari seluk-beluk Docker untuk menggunakan Caliban! Dengan Caliban, Anda dapat membuat dan menjalankan model ML di mesin Anda dan juga mengirimkan kode lokal ke cloud. Alat ini sangat cocok untuk alur kerja ML di Pytorch, Tensorflow, dan JAX.

10. Budou

Budou adalah alat pemecah garis otomatis yang dirancang untuk bahasa CJK (Cina, Jepang, dan Korea). Ini secara otomatis menerjemahkan teks CJK ke dalam kode HTML terorganisir, menghasilkan tipografi yang indah. Budou memecah judul dan kalimat menjadi beberapa baris potongan yang bermakna per lebar layar browser.

11. Dampak kausal

Proyek Google ini adalah perpustakaan statistik yang memperkirakan efek kausal intervensi pada model deret waktu. Paket CausalImpact R menggunakan deret waktu Bayesian struktural untuk menentukan bagaimana metrik respons berkembang setelah intervensi jika tidak terjadi sejak awal. Misalnya, cukup menantang untuk menjawab pertanyaan seperti “berapa banyak klik baru yang dihasilkan oleh kampanye pemasaran tertentu?” tanpa menggunakan eksperimen acak. CausalImpact dapat membantu menemukan jawaban atas pertanyaan tersebut.

12. DeepMind Lab

DeepMind Lab adalah platform game 3D orang pertama yang sepenuhnya dapat disesuaikan untuk R&D sistem Kecerdasan Buatan dan Pembelajaran Mesin. Ini terdiri dari sejumlah teka-teki yang menantang dan tugas navigasi yang sangat penting dalam pembelajaran penguatan mendalam. DeepMind Lab memiliki API yang rapi dan fleksibel yang memungkinkan Anda membuat desain tugas yang inovatif dan desain AI yang unik yang dapat segera diulang. DeepMind Google menggunakan DeepMind Lab secara ekstensif untuk meneliti dan melatih agen pembelajaran AI/ML.

13. Varian Dalam

DeepVariant adalah saluran analisis yang memanfaatkan jaringan saraf untuk menemukan varian genetik dari data sekuensing DNA generasi berikutnya. Ini menggunakan pustaka Nucleus (berisi kode Python dan C++) untuk membaca dan menulis data dalam format file genomik umum yang terintegrasi secara mulus dengan TensorFlow.

14. Dopamin

Ini adalah kerangka kerja penelitian berbasis TensorFlow yang dibuat untuk pembuatan prototipe cepat dari algoritme pembelajaran penguatan. Dopamin dirancang sebagai basis kode kecil dan intuitif yang memungkinkan pengguna bereksperimen dengan ide-ide radikal dan penelitian spekulatif. Ini memiliki empat prinsip desain inti:

Eksperimen mudah
Pengembangan yang fleksibel
Implementasi yang ringkas dan andal
Hasil yang dapat direproduksi

15. Goldfinch

Goldfinch adalah kumpulan data yang dibuat untuk memecahkan tantangan pengenalan yang rumit. Ini mencakup kumpulan kategori yang berbeda – burung, kupu-kupu, anjing, pesawat terbang, dan kategori lainnya bersama dengan URL pencarian Flickr yang relevan dan pencarian gambar Google. Kategori anjing mencakup banyak anotasi pembelajaran aktif. Google menggunakan Goldfinch untuk mengeksplorasi teknik Computer Vision dan Machine Learning untuk masalah pengenalan yang halus.

16. Kubeflow

Kubeflow adalah toolkit ML yang dirancang khusus untuk Kubernetes. Itu membuat penerapan alur kerja pembelajaran mesin (ML) di Kubernetes portabel dan skalabel. Tujuan utamanya adalah menawarkan cara sederhana untuk menerapkan OS terbaik di kelasnya untuk ML ke berbagai infrastruktur. Anda dapat menjalankan Kubeflow di sistem atau lingkungan apa pun yang menjalankan Kubernetes.

17. Magenta

Ini adalah proyek penelitian yang dikembangkan untuk mengeksplorasi bagaimana Machine Learning dalam menciptakan musik dan seni. Fokus utama proyek ini adalah untuk membangun pembelajaran mendalam dan algoritma pembelajaran penguatan untuk menghasilkan lagu, gambar, gambar, dan konten kreatif lainnya. Ini adalah upaya untuk menciptakan alat cerdas yang meningkatkan kemampuan dan potensi seniman dan musisi.

Kesimpulan

Sebagai penutup, saran terakhir kami adalah melalui proyek-proyek ini dan menghancurkannya untuk memahami nuansa yang lebih dalam. Ini akan membantu memperkaya pengetahuan ML Anda dan mengajari Anda cara kerja teknologi ML secara berbeda di setiap proyek.

Kami berharap dengan menyelam lebih dalam ke 17 proyek Pembelajaran Mesin sumber terbuka ini, Anda akan menemukan inspirasi untuk mengembangkan proyek Pembelajaran Mesin Anda sendiri!

Jika Anda tertarik untuk mempelajari lebih lanjut tentang pembelajaran mesin, lihat PG Diploma IIIT-B & upGrad dalam Pembelajaran Mesin & AI yang dirancang untuk para profesional yang bekerja dan menawarkan 450+ jam pelatihan ketat, 30+ studi kasus & tugas, IIIT- B Status alumni, 5+ proyek batu penjuru praktis & bantuan pekerjaan dengan perusahaan-perusahaan top.

Apa masalah yang terjadi saat menggunakan AI dalam perawatan kesehatan?

Bidang kedokteran menuntut transparansi dan kemampuan untuk menggambarkan keputusan klinis. Penggunaan pembelajaran mendalam dan model AI lainnya di sektor perawatan kesehatan sangat bermanfaat, tetapi menjelaskan modelnya cukup sulit. Ada juga pertimbangan etis tertentu yang dihadapi aplikasi klinis AI, seperti masalah privasi untuk data yang digunakan untuk pelatihan model AI dan masalah keamanan saat penerapan AI di bidang medis.

Bagaimana AI membuat perawatan kesehatan lebih murah dalam hal waktu dan uang?

Algoritma AI di bidang kedokteran lebih murah daripada pendekatan tradisional. Orang tidak perlu lagi menjalani serangkaian tes laboratorium yang mahal karena penggunaan teknologi AI dalam sistem perawatan kesehatan. Hal ini terlihat dari potensi AI dalam mengidentifikasi biomarker yang mampu mendeteksi kelainan tertentu pada tubuh manusia. Algoritme memastikan bahwa sebagian besar pekerjaan manual dalam menentukan biomarker ini dapat dilakukan secara otomatis. Dengan cara ini, mereka menghemat waktu yang sangat penting dalam bidang ini.

Bagaimana penggunaan AI memberdayakan pasien?

Teknologi yang dapat dikenakan, seperti jam tangan pintar, telah digunakan oleh banyak orang di seluruh dunia untuk menangkap data kesehatan harian mulai dari pola tidur hingga detak jantung. Ketika data ini digabungkan dengan pembelajaran mesin, dimungkinkan untuk berhasil menginformasikan individu apakah mereka berisiko terhadap penyakit tertentu jauh sebelum risiko menjadi parah atau tidak dapat diobati. Saat ini, aplikasi seluler memberikan informasi profil pasien tingkat granular, yang dapat membantu pasien yang hidup dengan kondisi kronis tertentu mengelola penyakit mereka dengan lebih baik dan dengan demikian menjalani hidup yang lebih sehat. Dengan pendekatan ini, AI berpotensi memberdayakan kita untuk membuat keputusan kesehatan yang lebih baik bagi diri kita sendiri.