Splotowe sieci neuronowe: najlepszy przewodnik dla początkujących w 2022 r.

Opublikowany: 2021-01-05

Szybkie wyszukiwanie w Google „nauki o danych” jednoznacznie pokaże każdemu, w jaki sposób
popularna dziedzina stała się w ciągu ostatnich pięciu lat. Wraz z nauką o danych, sztuczne
inteligencja, uczenie maszynowe i głębokie uczenie również robią popularne rundy w
dziedzinie informatyki. Ostatni dodany do tej listy to neuron splotowy
sieci — innowacja z dziedziny wizji komputerowej.

Spis treści

Gdzie to wszystko się zaczęło?

Sieci neuronowe stały się hitem w 2012 roku, kiedy Alex Krizhevsky wygrał
Konkurs ImageNet w tym roku. Ta konkurencja przypomina Olimpiadę Komputerową
wzroku i kiedy Alex ich używał, błąd klasyfikacji spadł z 26% do 15%.

To był Niepowtarzalny Laserowy Promień Nadziei, który firmy i komputery
potrzebni naukowcy. Od tego czasu firmy takie jak Instagram, Facebook, Pinterest itp.
entuzjastycznie wdrożyliśmy sieci neuronowe, aby zapewnić najlepsze wrażenia
ich publiczność. Przeczytaj: samouczek dotyczący sieci neuronowych.

Biologiczne połączenie konwolucyjnych sieci neuronowych pomoże również
podkład jasny. W 1962 Hubel i Wiesel wykazali, że różne neurony w
kora wzrokowa była uruchamiana tylko wtedy, gdy obecne były określone sygnały wzrokowe. Razem te
neurony miały strukturę kolumnową, a po odpaleniu wspólnie wytwarzały wizualne
postrzeganie.

Na przykład niektóre neurony odpalały się tylko wtedy, gdy były wystawione na poziome krawędzie.
Inni strzelali w obecności pionowych lub ukośnych krawędzi. Tak więc różne neurony
reagował na różne elementy wizualne i pozwalał nam widzieć.

Co to jest splotowa sieć neuronowa?

Splotowa sieć neuronowa — zwana także CNN lub ConvNet, to głębokie uczenie
algorytm. Pobiera obraz wejściowy, przypisuje wagi/obciążenia do składników
obraz, a następnie klasyfikuje cały obraz. Przy wystarczającej liczbie szkoleń ConvNets są
zdolny do uczenia się filtrów/klasyfikacji, a wymagane wstępne przetwarzanie jest mniejsze niż
w porównaniu z innymi algorytmami. Przeczytaj o różnicach między głębokim uczeniem a sieciami neuronowymi.

To, czego ostatecznie oczekujemy od splotowej sieci neuronowej, to różnicowanie
między obrazami i prawidłowo je klasyfikuj. Jest w stanie uchwycić zarówno czasowe, jak i
zależności przestrzenne dzięki zastosowaniu odpowiednich filtrów.

Podstawy, jak to działa

Obraz staje się tablicą w zależności od rozdzielczości i rozmiaru obrazu.

Każdy wpis w tablicy będzie składał się z liczby od 0 do 255 (jeśli system RGB to
używany). Ta liczba będzie reprezentować intensywność pikseli w tym punkcie.

Biorąc wszystkie te liczby jako dane wejściowe, komputer wypisze liczbę. Ten numer
będzie oznaczać prawdopodobieństwo przynależności obrazu do określonej klasy (np. dom,
droga, autobus, pies, kot itp.)

Struktura CNN

Widząc powyższy obraz, możesz pomyśleć, że w splotowym jest wiele warstw
sieć neuronowa, ale w rzeczywistości są tylko 3 główne. Obejmują one:
1. Warstwa splotowa
2. Warstwa puli
3. W pełni połączona warstwa
Zanurzmy się głębiej w każdy z nich.

Warstwa splotowa

Jest to warstwa rdzeniowa konwolucyjnej sieci neuronowej. Jego parametry to
składa się z zestawu filtrów. Filtry te są małe, ale pokrywają pełną głębokość
głośność wejściowa.

Głównym zadaniem wykonywanym w warstwie splotowej jest wydobycie wysokiego poziomu
funkcje. Pierwszy z nich (jak na powyższym obrazku) odpowiada za wydobywanie niskich
cechy poziomu, takie jak kolor, krawędzie itp. Kolejne splotowe warstwy usuwają
funkcje wysokiego poziomu, co prowadzi do pełnego zrozumienia/przeglądu obrazu.

Warstwa puli

Ta warstwa ma na celu zmniejszenie przestrzennego rozmiaru reprezentacji obrazu. Jako taki, to
pomaga również zmniejszyć ilość obliczeń i przetwarzania w sieci neuronowej.
Dodatkowo wydobywa również cechy dominujące, które są pozycyjne i rotacyjne
niezmienny.

Jeden typ puli jest wykonywany za pomocą operacji Max. Ta operacja wybiera
maksymalna wartość z każdego skupiska neuronów w poprzedniej warstwie. Inny rodzaj łączenia
jest pulą średnich, która zwraca średnią wartość z klastra.
Ponieważ łączenie Max działa również jako tłumik hałasu, działa lepiej niż Średnia
łączenie.

Jak pokazano na powyższym obrazku, oprócz
warstwy splotowe. Im większa liczba tych warstw, tym więcej obiektów niskiego poziomu
zostanie wyodrębniony. Jednak wydatkowana moc obliczeniowa również wzrośnie.

Teraz, gdy obraz przeszedł przez wszystkie obecne sploty i łączenie
warstwy, wyodrębnianie cech jest zakończone. Nadszedł czas na klasyfikację obrazu. Warstwa Fully Connected wykonuje to zadanie.

W pełni połączone warstwy (FCL)

Jako ostatnia warstwa, warstwa FC jest po prostu siecią neuronową ze sprzężeniem do przodu. Wejście do
w pełni połączona warstwa jest spłaszczonym wyjściem ostatniego łączenia/konwolucji
warstwa. Spłaszczenie oznacza, że trójwymiarowa macierz lub tablica jest rozwijana w wektor.

Dla każdej warstwy FC wykonywane są określone obliczenia matematyczne. Po przejściu wektora przez wszystkie w pełni połączone warstwy, funkcja aktywacji softmax jest używana w ostatniej warstwie. Służy do obliczania prawdopodobieństwa, że dane wejściowe należą do określonego zadania.

Tak więc wynikiem końcowym są różne prawdopodobieństwa obrazu wejściowego należące do różnych klas.

Proces jest powtarzany dla różnych typów obrazów i pojedynczych obrazów w ramach tych typów. To szkoli sieć i uczy rozróżniania między psem a kotem, różą i słonecznikiem.

Na wynos

Podstawowa technologia splotowych sieci neuronowych jest stale udoskonalana. Sieci są intensywnie przeszkolone, aby wyprowadzać dokładne prawdopodobieństwa. Można słusznie powiedzieć: w dziedzinie widzenia komputerowego CNN same w sobie stanowią rewolucję.

Możesz sprawdzić nasz dyplom PG w zakresie uczenia maszynowego i sztucznej inteligencji , który zapewnia praktyczne warsztaty praktyczne, mentor branżowy jeden do jednego, 12 studiów przypadków i zadań, status absolwentów IIIT-B i nie tylko.

Poprowadź rewolucję technologiczną napędzaną sztuczną inteligencją

DYPLOM PG Z UCZENIA MASZYNOWEGO I SZTUCZNEJ INTELIGENCJI

Ucz się więcej