Jak działa uczenie maszynowe – prosty przewodnik

Opublikowany: 2019-07-31

Netflix i Amazon świetnie sobie radzą w swojej grze – zawsze wydają się wiedzieć, jakie treści lub produkty chciałbyś zobaczyć/kupić. Czy nie lubisz patrzeć, jak wszystko jest już dopasowane do Twojego gustu i preferencji?

Podczas gdy większość z nas zna sekret sprytnego silnika rekomendacji Netflixa i Amazona (oczywiście uczenie maszynowe!), ilu z nas zna wewnętrzne mechanizmy uczenia maszynowego?

Mówiąc wprost – jak działa uczenie maszynowe ?

Zasadniczo uczenie maszynowe to technika analizy danych (podzbiór sztucznej inteligencji), której celem jest „uczenie się” na podstawie doświadczenia i umożliwianie maszynom wykonywania zadań wymagających inteligencji. Algorytmy uczenia maszynowego stosują metody obliczeniowe do wydobywania informacji i uczenia się bezpośrednio z danych bez konieczności ich wyraźnego programowania (bez konieczności polegania na z góry określonym równaniu).

Anatomia systemów uczenia maszynowego

Wszystkie systemy ML można rozłożyć na trzy części:

Model – komponent zajmujący się identyfikacją, czyli predykcjami.
Parametry – odnoszą się do czynników wykorzystywanych przez model do podejmowania decyzji (przewidywania).
Uczący się – element, który dostosowuje parametry (i jako całość model) poprzez uwzględnienie różnic w przewidywaniach w porównaniu z rzeczywistym wynikiem.

Rodzaje uczenia maszynowego

Teraz, gdy znasz już podstawowe komponenty systemów ML, nadszedł czas, aby przyjrzeć się różnym sposobom, w jakie się „uczą”.

Nadzorowana nauka

W uczeniu nadzorowanym model jest wyraźnie szkolony w zakresie mapowania danych wejściowych na dane wyjściowe. Algorytm uczenia nadzorowanego pobiera rozpoznany zestaw danych wejściowych wraz ze znanymi odpowiedziami (wyjściami) na te dane i trenuje model w celu wygenerowania rozsądnych prognoz w odpowiedzi na nowe dane wejściowe.

Uczenie nadzorowane wykorzystuje dwa podejścia do tworzenia modeli predykcyjnych –

Klasyfikacja – Jak sama nazwa wskazuje, ta technika klasyfikuje dane wejściowe do różnych kategorii, oznaczając je etykietami. Służy do przewidywania dyskretnych odpowiedzi (na przykład, jeśli komórka rakowa jest łagodna lub złośliwa). Obrazowanie medyczne, rozpoznawanie mowy i ocena kredytowa to trzy popularne przypadki użycia klasyfikacji.
Regresja — ta technika służy do przewidywania ciągłych odpowiedzi poprzez identyfikację wzorców w danych wejściowych. Na przykład wahania temperatury lub pogody. Regresja służy do prognozowania pogody, obciążenia energią elektryczną i handlu algorytmicznego.

Nauka nienadzorowana

Podejście nienadzorowanego uczenia się wykorzystuje nieoznakowane dane i stara się rozwikłać ukryte w nich wzorce. W ten sposób technika wyciąga wnioski z zestawów danych składających się z danych wejściowych pozbawionych oznaczonych odpowiedzi.

Grupowanie — jedna z najczęstszych nienadzorowanych metod uczenia się, grupowanie to technika eksploracyjnej analizy danych, która kategoryzuje dane w „klastry” bez żadnych znanych informacji o referencjach klastra. Rozpoznawanie obiektów i analiza sekwencji genów to dwa przykłady grupowania.
Redukcja wymiarowości – Redukcja wymiarowości czyści dane wejściowe ze wszystkich nadmiarowych informacji i zachowuje tylko podstawowe części. W ten sposób dane nie tylko stają się czyste, ale także zmniejszają się, przez co zajmują mniej miejsca.

Jak działa uczenie maszynowe

Nauka wzmacniania

Wzmacnianie uczenia ma na celu budowanie samopodtrzymujących się i samouczących się modeli, które można uczyć się i doskonalić metodą prób i błędów. W procesie uczenia się (treningu), jeśli algorytm może z powodzeniem wykonywać określone działania, wyzwalane są sygnały nagrody. Sygnały nagrody działają jak światła naprowadzające dla algorytmów. Istnieją dwa sygnały nagrody:

Pozytywny sygnał jest wyzwalany, aby zachęcić i kontynuować określoną sekwencję działań.
Negatywny sygnał jest karą za konkretne złe działanie. Wymaga poprawienia błędu przed kontynuowaniem procesu szkoleniowego.

Uczenie się przez wzmacnianie jest szeroko stosowane w grach wideo. Jest to również mechanizm stojący za samochodami autonomicznymi.

Wewnątrz funkcji „uczenia się” algorytmów ML

Za funkcjonowaniem algorytmów ML i sposobem uczenia się poprzez doświadczenie kryją się trzy wspólne zasady.

Nauka funkcji

Pierwszym krokiem w procesie uczenia się jest poznanie przez algorytmy ML funkcji docelowej (f), która najlepiej mapuje zmienną wejściową (X) na zmienną wyjściową (Y). Więc,

Y = f(X).

Tutaj postać funkcji celu (f) jest nieznana, stąd modelowanie predykcyjne.

W tej ogólnej fazie uczenia się algorytm ML uczy się, jak dokonywać prognoz na przyszłość (Y) na podstawie nowych zmiennych wejściowych (X). Oczywiście proces nie jest wolny od błędów. Tutaj błąd (e) istnieje niezależnie od danych wejściowych (X). Więc,

Y = f(X) + e

Ponieważ błąd (e) może nie mieć wystarczających atrybutów, aby najlepiej scharakteryzować scenariusz mapowania od X do Y, nazywany jest błędem nieredukowalnym – niezależnie od tego, jak dobry algorytm osiąga estymację funkcji celu (f), nie można zredukować błędu ( mi).

Prognozowanie i nauka, jak je poprawiać

We wcześniejszym punkcie zrozumieliśmy, w jaki sposób algorytm ML uczy się funkcji celu (f). I już wiemy, że naszym jedynym i jedynym celem jest znalezienie najlepszego możliwego sposobu odwzorowania Y z X. Innymi słowy, musimy znaleźć najdokładniejszy sposób odwzorowania wejścia na wyjście.

Będą błędy (e), tak, ale algorytm musi ciągle próbować zrozumieć, jak daleko jest od pożądanego wyniku (Y) i jak do niego dotrzeć. W tym procesie będzie stale dostosowywał parametry lub wartości wejściowe (X), aby jak najlepiej dopasować wyjście (Y). Będzie to trwało, dopóki nie osiągnie wysokiego stopnia podobieństwa i dokładności z pożądanym modelem wyjściowym.

Jak nauczyć się uczenia maszynowego – krok po kroku

Podejście do nauki „Gradient Descent”

Może być prawdą, że odnieśliśmy sukces w tworzeniu „inteligentnych” maszyn, ale ich tempo uczenia się jest różne – maszyny zwykle robią to wolno. Wierzą w proces uczenia się „gradientowego zejścia” – nie robisz skoku od razu, ale stawiasz małe kroczki i powoli schodzisz ze szczytu (metaforą jest tu schodzenie z góry).

Podczas schodzenia z góry nie skaczesz, nie biegniesz ani nie rzucasz się w dół za jednym zamachem; zamiast tego podejmujesz zmierzone i obliczone kroki, aby bezpiecznie zejść na dno i uniknąć wpadek.

Algorytmy ML wykorzystują to podejście – dostosowują się do zmieniających się parametrów (ponownie wyobrażają sobie nierówny i niezbadany teren góry), aby ostatecznie uzyskać pożądany efekt.

Podsumowując…

Podstawowym celem wszystkich algorytmów uczenia maszynowego jest opracowanie modelu predykcyjnego, który najlepiej uogólnia konkretne dane wejściowe. Ponieważ algorytmy i systemy ML szkolą się poprzez różne rodzaje danych wejściowych/zmiennych/parametrów, konieczne jest posiadanie ogromnej puli danych. Ma to umożliwić algorytmom ML interakcję z różnymi rodzajami danych w celu poznania ich zachowania i uzyskania pożądanych wyników.

Mamy nadzieję, że tym postem moglibyśmy dla Was zdemistyfikować działanie uczenia maszynowego!

Uczenie maszynowe dla każdego‎

Twórz aplikacje i wdrażaj sztuczną inteligencję oraz uczenie maszynowe, aby rozwiązywać rzeczywiste problemy. Zdobądź dyplom PG z uczenia maszynowego i sztucznej inteligencji od upGrad.

Zarejestruj się teraz @ Upgrade