Top 17 projektów uczenia maszynowego typu open source [dla nowicjuszy i doświadczonych]
Opublikowany: 2020-12-22Sztuczna inteligencja i uczenie maszynowe zapowiadają czwartą rewolucję przemysłową. Firmy o różnych kształtach i rozmiarach we wszystkich branżach stosują te przełomowe technologie w celu projektowania innowacyjnych rozwiązań spełniających wymagania ich docelowych klientów.
W związku z tym istnieje ogromne zapotrzebowanie na utalentowanych profesjonalistów, którzy są dobrze zorientowani w niuansach AI i ML. W rzeczywistości firmy są gotowe zapłacić najwyższą sumę zasłużonym kandydatom z odpowiednim zestawem umiejętności.
W świetle rosnącego zapotrzebowania na umiejętności AI i ML, dobrze jest mieć na swoim koncie kilka rzeczywistych projektów. Kiedy pracujesz nad projektami, pokazuje potencjalnym pracodawcom, że masz siłę i wiedzę, aby przyswoić sobie te technologie.
Jeśli szukasz inspirujących projektów uczenia maszynowego typu open source, trafiłeś we właściwe miejsce!
Spis treści
Projekty uczenia maszynowego typu open source
Projekty uczenia maszynowego GitHub typu open source
1. DeOldify
DeOldify to model głębokiego uczenia przeznaczony do kolorowania i przywracania starych obrazów. Możesz pokolorować stare zdjęcia i nagrania filmowe za pomocą DeOldify, który fantastycznie zaszczepia w nich życie! Został zaktualizowany, aby zapewnić bardziej szczegółowe i realistyczne retuszowanie obrazów w skali szarości. Ponadto wyniki pokazują znacznie mniej niebieskiego błędu przy minimalnych trzaskach.

2. Rozpoznawanie twarzy
Ta aplikacja szczyci się tym, że jest „najprostszym na świecie interfejsem API rozpoznawania twarzy dla Pythona i wiersza poleceń”. Może rozpoznawać i manipulować twarzami z Pythona lub wiersza poleceń za pomocą najnowocześniejszego oprogramowania do rozpoznawania twarzy dlib. Ten model głębokiego uczenia twierdzi, że ma 99,38% wskaźnik dokładności według testu porównawczego LFW . Możesz użyć narzędzia wiersza polecenia „rozpoznawanie twarzy”, aby wykonać rozpoznawanie twarzy w folderze obrazów z wiersza poleceń!
3. Klonowanie głosu
Ten projekt ML jest implementacją transferu uczenia się od weryfikacji mówcy do wielogłośnikowej syntezy tekstu na mowę (SV2TTS). SV2TTS to narzędzie do głębokiego uczenia się, które może generować numeryczną reprezentację głosu z dowolnego klipu audio i trenować model zamiany tekstu na mowę w celu uogólnienia na nowe głosy. Ta aplikacja może sklonować dowolny głos w 5 sekund i wygenerować dowolną mowę, a wszystko to w czasie rzeczywistym!
4. Rozmowa neuronowa2
NeuralTalk2 to zasadniczo kod do przechwytywania obrazów napisany w Lua. Działa na GPU i wymaga Torch. NeuralTalk2 może opisywać obrazy/wideo zdaniami, wykorzystując Multimodal Recurrent Neural Network. Jest to idealne narzędzie dla twórców treści w mediach społecznościowych – możesz generować napisy do swoich zdjęć/filmów, a także możesz użyć tego modelu do tworzenia zabawnych treści graficznych/wideo (te z zabawnymi napisami).
Przeczytaj: Kariera w uczeniu maszynowym
5. U-GAT-IT
U-GAT-IT (Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation) to projekt ML skupiający się na prostym przetłumaczeniu obrazu osoby na jej awatar anime. Model ten może konwertować obrazy wymagające całościowych zmian i obrazy wymagające dużych zmian kształtu, wykorzystując nowatorską, nienadzorowaną technikę tłumaczenia obrazu na obraz. Nie trzeba dodawać, że jest to idealny projekt dla miłośników anime!
6. Srez
Srez wykorzystuje głębokie uczenie, aby uzyskać super rozdzielczość obrazu – może przeskalować obrazy 16×16 czterokrotnie w celu wygenerowania zdjęć 64×64. Wyniki przedstawiają wyraźne i wyróżniające się cechy, które wydają się wystarczająco godne pochwały w porównaniu z treningowym zestawem danych. Podstawowa architektura obejmuje DCGAN, który akceptuje wejścia obrazu 16×16 do sieci generatora zamiast wielomianowej dystrybucji gaussowskiej.
7. AVA
AVA to platforma, której celem jest dostarczanie zautomatyzowanej analizy wizualnej opartej na sztucznej inteligencji. Pierwsze „A” w AVA ma wiele konotacji – jest to platforma Alibaba, która dąży do tego, aby stać się „zautomatyzowanym, opartym na sztucznej inteligencji rozwiązaniem, które obsługuje rozszerzoną analitykę”. AVA obejmuje trzy pakiety, a mianowicie CKB (przestrzeń do przechowywania wiedzy empirycznej do wizualizacji/wykresów), DataWizard (biblioteka przetwarzania danych) oraz ChartAdvisor (podstawowy komponent, który sugeruje wykresy zgodnie z wymaganiami zbioru danych i analizy).
8. Megatron
Opracowany przez zespół firmy NVIDIA Applied Deep Learning Research, Megatron jest potężnym transformatorem, który może trenować obszerne modele językowe, aby poprawić ich wydajność w miarę ich skalowania. Jest to trwający projekt, który obsługuje równoległe, wielowęzłowe szkolenie BERT i GPT2 z mieszaną precyzją.
Projekty uczenia maszynowego Google typu open source
9. Kaliban
Caliban to narzędzie przeznaczone do opracowywania przepływów pracy i notebooków związanych z badaniem ML w izolowanych i odtwarzalnych środowiskach Docker. Najlepsza część – nie musisz nawet uczyć się zawiłości Dockera, aby używać Calibana! Dzięki Caliban możesz budować i uruchamiać modele ML na swoim komputerze, a także wysyłać kod lokalny do chmury. To narzędzie jest idealne do przepływów pracy ML w programach Pytorch, Tensorflow i JAX.

10. Budou
Budou to narzędzie do automatycznego łamania wierszy zaprojektowane dla języków CJK (chiński, japoński i koreański). Automatycznie tłumaczy tekst CJK na uporządkowany kod HTML, co daje piękną typografię. Budou dzieli nagłówki i zdania na wiele wierszy znaczących fragmentów na szerokość ekranu przeglądarki.
11. Wpływ przyczynowy
Ten projekt Google to biblioteka statystyk, która szacuje wpływ przyczynowy interwencji na model szeregów czasowych. Pakiet CausalImpact R wykorzystuje strukturalny szereg czasowy bayesowski do określenia, w jaki sposób metryka odpowiedzi ewoluuje po interwencji, jeśli nie nastąpiła ona w pierwszej kolejności. Na przykład dość trudno jest odpowiedzieć na pytanie typu „ile nowych kliknięć wygenerowała konkretna kampania marketingowa?” bez użycia losowego eksperymentu. CausalImpact może pomóc znaleźć odpowiedzi na takie pytania.
12. Laboratorium DeepMind
DeepMind Lab to w pełni konfigurowalna, pierwszoosobowa platforma gier 3D do badań i rozwoju systemów sztucznej inteligencji i uczenia maszynowego. Składa się z wielu trudnych łamigłówek i zadań nawigacyjnych, które są kluczowe w nauce głębokiego wzmacniania. DeepMind Lab ma schludny i elastyczny interfejs API, który pozwala tworzyć innowacyjne projekty zadań i unikalne projekty sztucznej inteligencji, które można szybko iterować. DeepMind firmy Google intensywnie wykorzystuje DeepMind Lab do badania i szkolenia agentów uczących AI/ML.
13. Głęboki wariant
DeepVariant to potok analityczny, który wykorzystuje sieć neuronową do znajdowania wariantów genetycznych na podstawie danych sekwencjonowania DNA nowej generacji. Wykorzystuje bibliotekę Nucleus (zawierającą kod Python i C++) do odczytywania i zapisywania danych w popularnych formatach plików genomicznych, które bezproblemowo integrują się z TensorFlow.
14. Dopamina
Jest to platforma badawcza oparta na TensorFlow, stworzona do szybkiego prototypowania algorytmów uczenia przez wzmacnianie. Dopamina została zaprojektowana jako mała i intuicyjna baza kodów, która umożliwia użytkownikom eksperymentowanie z radykalnymi pomysłami i badaniami spekulacyjnymi. Ma cztery podstawowe zasady projektowania:
- Łatwe eksperymentowanie
- Elastyczny rozwój
- Kompaktowa i niezawodna realizacja
- Powtarzalne wyniki
15. Szczygieł
Goldfinch to zbiór danych stworzony do rozwiązywania problemów związanych z precyzyjnym rozpoznawaniem. Obejmuje zbiór różnych kategorii — ptaków, motyli, psów, samolotów i innych kategorii, wraz z odpowiednimi adresami URL wyszukiwania w serwisie Flickr i wyszukiwaniami obrazów Google. Kategoria pies zawiera liczne aktywne adnotacje do nauki. Google wykorzystuje Goldfinch do badania technik widzenia komputerowego i uczenia maszynowego w celu rozwiązywania problemów z precyzyjnym rozpoznawaniem.

16. Kubeflow
Kubeflow to zestaw narzędzi ML zaprojektowany specjalnie dla Kubernetes. Dzięki temu wdrażanie przepływów pracy uczenia maszynowego (ML) w Kubernetes jest przenośne i skalowalne. Głównym celem jest zaoferowanie prostego sposobu wdrażania najlepszego w swojej klasie systemu operacyjnego dla ML w wielu różnych infrastrukturach. Możesz uruchomić Kubeflow w dowolnym systemie lub środowisku z Kubernetes.
17. Magenta
Jest to projekt badawczy opracowany w celu zbadania, w jaki sposób uczenie maszynowe w tworzeniu muzyki i sztuki. Głównym celem tego projektu jest budowanie algorytmów uczenia głębokiego i wzmacniania w celu tworzenia piosenek, obrazów, rysunków i innych kreatywnych treści. To próba stworzenia inteligentnych narzędzi, które wzmacniają umiejętności i potencjał artystów i muzyków.
Wniosek
Podsumowując, naszą ostatnią radą byłoby przejrzenie tych projektów i dezintegracja ich, aby zrozumieć głębsze niuanse. Pomoże to wzbogacić Twoją wiedzę o ML i nauczy Cię, jak technologie ML działają inaczej w każdym projekcie.
Mamy nadzieję, że zagłębiając się w te 17 projektów uczenia maszynowego typu open source, znajdziesz inspirację do opracowania własnego projektu uczenia maszynowego!
Jeśli chcesz dowiedzieć się więcej o uczeniu maszynowym, sprawdź dyplom PG IIIT-B i upGrad w uczeniu maszynowym i sztucznej inteligencji, który jest przeznaczony dla pracujących profesjonalistów i oferuje ponad 450 godzin rygorystycznego szkolenia, ponad 30 studiów przypadków i zadań, IIIT- Status absolwenta B, ponad 5 praktycznych, praktycznych projektów zwieńczenia i pomoc w pracy z najlepszymi firmami.
Jakie problemy pojawiają się podczas korzystania ze sztucznej inteligencji w opiece zdrowotnej?
Dziedzina medycyny wymaga przejrzystości i umiejętności opisywania decyzji klinicznych. Wykorzystanie głębokiego uczenia i innych modeli sztucznej inteligencji w sektorze opieki zdrowotnej jest bardzo korzystne, ale wyjaśnienie modeli jest nie lada zadaniem. Istnieją również pewne względy etyczne, z którymi borykają się zastosowania kliniczne sztucznej inteligencji, takie jak obawy dotyczące prywatności danych wykorzystywanych do szkolenia modeli sztucznej inteligencji oraz kwestie bezpieczeństwa podczas wdrażania sztucznej inteligencji w medycynie.
W jaki sposób sztuczna inteligencja sprawia, że opieka zdrowotna jest tańsza pod względem czasu i pieniędzy?
Algorytmy AI w dziedzinie medycyny są tańsze niż tradycyjne podejścia. Dzięki wykorzystaniu technologii sztucznej inteligencji w systemie opieki zdrowotnej ludzie nie muszą już przechodzić mnóstwa kosztownych testów laboratoryjnych. Widać to w potencjale sztucznej inteligencji w identyfikowaniu biomarkerów zdolnych do wykrywania pewnych zaburzeń w ludzkim ciele. Algorytmy zapewniają, że większość ręcznej pracy przy określaniu tych biomarkerów może być zautomatyzowana. W ten sposób oszczędzają czas, który w tej dziedzinie jest bardzo istotny.
W jaki sposób korzystanie ze sztucznej inteligencji wzmacnia pacjentów?
Technologia ubieralna, taka jak inteligentne zegarki, jest już wykorzystywana przez ogromną liczbę osób na całym świecie do przechwytywania codziennych danych dotyczących zdrowia, od wzorców snu po tętno. Gdy te dane zostaną połączone z uczeniem maszynowym, może być możliwe skuteczne informowanie osób, czy są one zagrożone określonymi chorobami, na długo zanim ryzyko stanie się poważne lub nieuleczalne. Obecnie aplikacje mobilne dostarczają szczegółowych informacji o profilu pacjenta, co może pomóc pacjentom żyjącym z niektórymi chorobami przewlekłymi lepiej radzić sobie z chorobą, a tym samym prowadzić zdrowsze życie. Dzięki takiemu podejściu sztuczna inteligencja ma potencjał, aby umożliwić nam podejmowanie lepszych decyzji zdrowotnych dla nas samych.