Najlepsze typy modeli uczenia głębokiego, które inżynierowie AI powinni poznać w 2022 r.

Opublikowany: 2021-01-01

Spis treści

Wstęp

Deep Learning to technika uczenia maszynowego, która wykorzystuje różne warstwy nieliniowego przetwarzania informacji do nienadzorowanej i nadzorowanej transformacji, wyodrębniania funkcji, klasyfikacji i analizy wzorców.

Jeśli chodzi o przetwarzanie informacji w sposób nieliniowy, składa się on z różnych warstw hierarchicznych. Tutaj niektóre koncepcje niskiego poziomu są w stanie zdefiniować koncepcje wyższego poziomu. Uczenie nadzorowane jest formą uczenia maszynowego zestawu szkoleniowego, a zestaw przykładów jest przesyłany jako dane wejściowe do systemu podczas fazy szkolenia.

Ponieważ każde wejście jest oznaczone wartością wyjściową, system zna dane wyjściowe, gdy dostarczany jest zestaw wejść. Z drugiej strony w uczeniu nienadzorowanym wejścia nie są oznaczone klasą, do której należą. Stąd to od systemu zależy opracowanie i uporządkowanie danych poprzez poszukiwanie wspólnych cech i dokonywanie niezbędnych zmian w oparciu o wewnętrzną wiedzę.

Sztuczne sieci neuronowe są płytkie. W związku z tym nie mogą poradzić sobie ze złożonymi danymi, jakie można znaleźć w codziennych zastosowaniach, takich jak obrazy, mowa naturalna, wyszukiwanie informacji i aplikacje do przetwarzania informacji podobnych do ludzkich. W przypadku tego rodzaju aplikacji modele uczenia głębokiego są idealne. Za pomocą głębokiego uczenia można przy mniejszym wysiłku klasyfikować, rozpoznawać i kategoryzować wzorce danych dla maszyny.

Powiązany artykuł: Najlepsze techniki głębokiego uczenia

Typy modeli głębokiego uczenia

Modele uczenia głębokiego ewoluują, a większość z nich opiera się na sztucznych sieciach neuronowych. Najważniejszym z nich są konwolucyjne sieci neuronowe (CNN). Obejmuje również zmienne ukryte i formuły zdań zorganizowane warstwowo w głębokich modelach generatywnych.

Autokodery

Jest to sztuczna sieć neuronowa, która może uczyć się na podstawie różnych wzorców kodowania. Autokoder jest podobny do perceptronu wielowarstwowego, który ma warstwę wejściową, warstwę ukrytą lub warstwę wyjściową w najprostszej postaci. Warstwa wyjściowa ma taką samą liczbę węzłów jak warstwa wyjściowa. Nie przewiduje wartości docelowych na podstawie wektora wyjściowego; zamiast tego Autoenkoder może przewidzieć swoje dane wejściowe. Ten mechanizm uczenia się można przedstawić w następujący sposób:

Dla każdego wejścia x,

Aktywacja obliczeń poprzez umożliwienie przekazywania sprzężenia do przodu w każdej warstwie ukrytej i warstwie wyjściowej
Wykorzystaj odpowiednie funkcje błędu do wykrywania odchyleń między obliczonymi wartościami
Zaktualizuj wagi przez wsteczną propagację błędu
Powtarzaj zadanie, aż wygeneruje zadowalające wyniki

Jeśli warstwa ukryta ma mniej węzłów niż węzły wejścia-wyjścia, wówczas aktywacja ostatniej warstwy ukrytej jest traktowana jako skompresowana reprezentacja danych wejściowych. Jeśli ukrytych węzłów warstwy jest więcej, autokoder pozna funkcję tożsamości i okaże się bezużyteczny w większości przypadków.

Głęboka sieć wierzeń

Stanowi rozwiązanie do obsługi minimów lokalnych i niewypukłych funkcji celu z typowym wielowarstwowym perceptronem. Możesz myśleć o tym jako o alternatywnym typie głębokiego uczenia, który składa się z wielu warstw ukrytych zmiennych połączonych z innymi warstwami. Jest to ograniczona wersja maszyn Boltzmanna.

Tutaj ukryte warstwy każdej podsieci będą służyć jako widoczna warstwa wejściowa dla sąsiedniej warstwy sieci. Tym samym sprawia, że najniższa widoczna warstwa jest zbiorem uczącym dla sąsiedniej warstwy sieci. Dzięki temu każdą warstwę sieci można szkolić zachłannie i niezależnie. Każda warstwa głębokiej struktury wykorzystuje ukryte zmienne jako obserwowane zmienne do trenowania każdej warstwy głębokiej struktury. Algorytm uczenia sieci głębokich przekonań jest następujący:

Weź pod uwagę wektory wejściowe
Użyj wektora wejściowego do trenowania maszyny Boltzmanna i uzyskaj macierz wag
Użyj macierzy wag do trenowania dwóch niższych warstw sieci
Użyj sieciowego RBM do generowania nowego wektora wejściowego poprzez średnią aktywację i próbkowanie jednostek ukrytych.
Powtarzaj procedurę, aż dojdziesz do dwóch górnych warstw sieci.

Przeczytaj także: Głębokie uczenie a sieci neuronowe

Konwolucyjne sieci neuronowe (CNN)

Jest to kolejny wariant perceptronu wielowarstwowego opartego na sprzężeniu do przodu. Organizuje poszczególne neurony w taki sposób, aby odpowiadały na wszystkie nakładające się regiony w polu widzenia. Jest to jeden z algorytmów głębokiego uczenia się, który może pobierać obraz wejściowy i przypisywać wagę do uczących się błędów i wag różnych aspektów/obiektów na obrazie.

Potrafi odróżnić jedno od drugiego. Potrzeba wstępnego przetwarzania w CNN jest dość niska w porównaniu z innymi algorytmami klasyfikacji. CNN posiada zdolność uczenia się tych cech i filtrów.

CNN to jedna z głównych kategorii dla następujących:

Wykrycia obiektów

Klasyfikacje obrazów

Rozpoznawanie obrazów

Rozpoznawanie twarzy itp.

To tylko niektóre z nielicznych obszarów, w których CNN może być szeroko wykorzystywane.

W przypadku klasyfikacji obrazów CNN zaakceptuje obraz wejściowy, przetworzy go i dokona klasyfikacji w różnych kategoriach. Komputery wizualizują obrazy wejściowe jako tablicę pikseli i jest to zmienna rozdzielczości obrazu. Technicznie rzecz biorąc, modele CNN poddadzą każdy obraz wejściowy przez kilka warstw splotowych z filtrami do uczenia i testowania.

Pierwsza warstwa jest znana jako Convolution i jest przypisana do wyodrębniania cech z obrazu wejściowego. Konwolucja może zachować relacje między pikselami, ponieważ może nauczyć się cech obrazu poprzez użycie małych kwadratów danych wejściowych. Wykonuje operację matematyczną, pobierając dwa dane wejściowe: macierz obrazu i filtr lub jądro.

Kiedy splot obrazu jest wyposażony w różne filtry, będzie mógł wykonywać takie operacje, jak wykrywanie krawędzi, wyostrzanie i rozmycie przez filtry.

W ciągu ostatnich kilku lat nastąpił znaczny postęp w dziedzinie wizji komputerowej. Jednym z największych osiągnięć jest CNN. Głębokie CNN ewoluowały, aby stać się najbardziej popularnymi aplikacjami do widzenia komputerowego używanymi w rozpoznawaniu gestów, autonomicznych samochodach, automatycznym oznaczaniu znajomych na zdjęciach publikowanych na Facebooku, funkcjach ochrony twarzy i automatycznym rozpoznawaniu tablic rejestracyjnych.

Rekurencyjne sieci neuronowe

Jest to rodzaj sieci neuronowej, w której dane wyjściowe z poprzedniego kroku mogą być podawane jako dane wejściowe do bieżącego kroku. Wejścia i wyjścia w konwencjonalnej sieci neuronowej są od siebie niezależne. Natomiast w przypadkach, gdy zachodzi potrzeba przewidzenia kolejnych słów w zdaniu, konieczne będzie zapamiętanie poprzednich słów.

Pojawienie się RNN obiecuje rozwiązanie tego problemu za pomocą ukrytej warstwy. Jedną z kluczowych cech RNN jest stan ukryty, zdolny do zapamiętywania pewnych informacji w sekwencji.

RNN jest wyposażony w pamięć, która może zapamiętać wszystkie informacje o obliczeniach. Może używać tych samych parametrów dla każdego wejścia do wykonywania tych samych zadań na wszystkich wejściach lub ukrytych warstw w celu uzyskania pożądanego wyjścia. Znacznie zmniejszy złożoność parametrów, co jest w ostrym kontraście z innymi sieciami neuronowymi.

Końcowe przemyślenia

Obliczanie gradientów jest uzależnione nie tylko od bieżącego kroku, ale także od poprzedniego kroku. Istnieje wariant zwany dwukierunkową rekurencyjną siecią neuronową, która jest używana przez kilka aplikacji. Tutaj sieć uwzględnia poprzednią i oczekiwaną przyszłą produkcję. Wprowadzając wiele ukrytych warstw, głębokie uczenie można osiągnąć w dwukierunkowych prostych, rekurencyjnych sieciach neuronowych.

Jeśli chcesz dowiedzieć się więcej o technikach głębokiego uczenia , uczeniu maszynowym, sprawdź certyfikat PG IIIT-B i upGrad w zakresie uczenia maszynowego i głębokiego uczenia się, który jest przeznaczony dla pracujących profesjonalistów i oferuje ponad 240 godzin rygorystycznych szkoleń, ponad 5 studiów przypadków i zadania, status absolwentów IIIT-B i pomoc w pracy z najlepszymi firmami.

Poprowadź rewolucję technologiczną napędzaną sztuczną inteligencją

DYPLOM PG Z UCZENIA MASZYNOWEGO I SZTUCZNEJ INTELIGENCJI

Ucz się więcej