Jak działa nienadzorowane uczenie maszynowe?

Opublikowany: 2018-06-13

Nauka nienadzorowana odnosi się do szkolenia systemu SI z wykorzystaniem informacji, które nie są sklasyfikowane ani nieoznaczone. Idealnie oznacza to, że algorytm musi działać na informacjach bez żadnych uprzednich wskazówek.
W uczeniu nienadzorowanym maszyna grupuje nieposortowane/nieuporządkowane informacje dotyczące podobieństw i różnic. Odbywa się to bez zapewniania kategorii, na które maszyna może kategoryzować dane. Systemy wykorzystujące takie uczenie są na ogół kojarzone z generatywnym modelem uczenia się.

Spis treści

Jak działa nienadzorowane uczenie maszynowe?

W nienadzorowanym uczeniu system AI jest prezentowany z nieoznakowanymi, nieskategoryzowanymi danymi, a algorytmy systemu działają na danych bez wcześniejszego szkolenia. Dane wyjściowe zależą od zakodowanych algorytmów. Poddanie systemu nienadzorowanemu uczeniu się jest ustalonym sposobem testowania możliwości tego systemu.
Algorytmy uczenia nienadzorowanego mogą wykonywać bardziej złożone zadania przetwarzania niż systemy uczenia nadzorowanego. Jednak uczenie nienadzorowane może być bardziej nieprzewidywalne niż model alternatywny. System wyszkolony przy użyciu modelu nienadzorowanego może na przykład samodzielnie wymyślić, jak odróżnić koty od psów, może również dodać nieoczekiwane i niepożądane kategorie, aby poradzić sobie z nietypowymi rasami, co może skończyć się bałaganem, zamiast trzymać je w zamówienie.

W przypadku nienadzorowanych algorytmów uczenia system AI jest prezentowany z nieoznakowanym i nieskategoryzowanym zbiorem danych. Należy pamiętać, że ten system nie przeszedł żadnego wcześniejszego szkolenia. Zasadniczo uczenie się bez nadzoru może być traktowane jako uczenie się bez nauczyciela.
W przypadku uczenia nadzorowanego system posiada zarówno wejścia, jak i wyjścia. Tak więc w zależności od różnicy między pożądanymi a obserwowanymi wynikami, system jest nastawiony na uczenie się i doskonalenie. Jednak w przypadku uczenia nienadzorowanego system ma tylko wejścia, a nie ma wyjść.
Czym jest uczenie maszynowe i dlaczego ma to znaczenie

Nauka bez nadzoru jest niezwykle pomocna podczas zadań związanych z eksploracją danych i wyodrębnianiem funkcji. Ostatecznym celem uczenia się bez nadzoru jest odkrycie ukrytych trendów i wzorców w danych lub wyodrębnienie pożądanych cech. Jak powiedzieliśmy wcześniej, nienadzorowane uczenie się dotyczy tylko zestawu danych wejściowych bez wcześniejszej wiedzy lub uczenia się. Dlatego istnieją dwa rodzaje uczenia się nienadzorowanego:

Parametryczne nienadzorowane uczenie się

Nienadzorowane uczenie parametryczne zakłada parametryczny rozkład danych. Oznacza to, że ten rodzaj nienadzorowanego uczenia się zakłada, że dane pochodzą z populacji o określonym rozkładzie prawdopodobieństwa opartym na pewnych parametrach. Teoretycznie, jeśli rozważymy rozkład normalny rodziny obiektów, zobaczymy, że wszystkie elementy mają podobną charakterystykę i są zawsze sparametryzowane przez średnią i odchylenie standardowe. Oznacza to, że jeśli znamy średnią i odchylenie standardowe, a rozkład jest normalny, to bardzo łatwo możemy określić prawdopodobieństwo przyszłych obserwacji. Nienadzorowane uczenie parametryczne jest znacznie trudniejsze niż standardowe uczenie nadzorowane, ponieważ nie ma dostępnych etykiet; stąd nie ma z góry określonej miary dokładności do testowania wyjścia.

Nieparametryczne uczenie nienadzorowane

Nieparametryczne uczenie nienadzorowane odnosi się do grupowania zbioru danych wejściowych. Zasadniczo każdy klaster mówi coś o kategoriach i klasach elementów danych obecnych w zestawie. Jest to najczęściej stosowana metoda modelowania danych i analizowania danych przy małych próbkach. Metody te są również określane jako metody bezdystrybucyjne, ponieważ w przeciwieństwie do uczenia parametrycznego, modelarz nie musi dokonywać żadnych założeń dotyczących rozmieszczenia całej populacji.
Te 6 technik uczenia maszynowego usprawnia opiekę zdrowotną

W tym momencie konieczne jest zagłębienie się w to, co rozumiemy przez klastrowanie.

Czym więc jest klastrowanie?

Klastrowanie jest jednym z najważniejszych pojęć leżących u podstaw uczenia się bez nadzoru. Zajmuje się znajdowaniem struktury lub wzorca w zbiorze nieskategoryzowanych danych. Prostą definicją klastra może być „proces grupowania obiektu w klasy w taki sposób, że każdy element klasy jest podobny do drugiego w taki lub inny sposób”.
Dlatego klaster można po prostu zdefiniować jako zbiór obiektów danych, które są „podobne” do klastra i „odmienne” do obiektów drugiego klastra.

Zastosowania nienadzorowanego uczenia maszynowego

Celem nienadzorowanego uczenia maszynowego jest odkrycie wcześniej ukrytych wzorców i trendów w danych. Jednak przez większość czasu wzorce danych są słabymi przybliżeniami tego, co może osiągnąć nadzorowane uczenie maszynowe – na przykład dzielą klientów na duże grupy, zamiast traktować ich jako osoby i dostarczać wysoce spersonalizowaną komunikację. W przypadku uczenia się nienadzorowanego nie wiemy, jaki będzie wynik, a zatem, jeśli musimy zaprojektować model predykcyjny, uczenie nadzorowane ma większy sens w kontekście rzeczywistym.
Idealnym przypadkiem użycia nienadzorowanego uczenia maszynowego jest brak danych na temat pożądanych wyników. Na przykład, jeśli chcesz określić rynek docelowy dla całkowicie nowego produktu. Jeśli jednak chcesz lepiej kategoryzować swoją bazę klientów, nadzorowane uczenie się jest lepszą opcją.
5 przełomowych zastosowań uczenia maszynowego

Przyjrzyjmy się niektórym zastosowaniom nienadzorowanych technik uczenia maszynowego:

Nienadzorowane uczenie się jest niezwykle pomocne w wykrywaniu anomalii w zbiorze danych. Wykrywanie anomalii odnosi się do znajdowania istotnych punktów danych w zbiorze danych. Jest to bardzo przydatne przy wykrywaniu fałszywych transakcji, wykrywaniu uszkodzonych elementów sprzętu lub identyfikowaniu odstających elementów, które mogły wkraść się podczas wprowadzania danych.
Eksploracja skojarzeń oznacza identyfikację zestawu elementów, które występują razem w zestawie danych. Jest to dość pomocna technika analizy koszyka, ponieważ pozwala analitykom odkryć dobro często kupowane razem. Eksploracja skojarzeń nie jest możliwa bez grupowania danych, a kiedy mówimy o klastrowaniu, mówimy o algorytmie uczenia maszynowego bez nadzoru.
Jeszcze jednym przypadkiem użycia uczenia nienadzorowanego jest redukcja wymiarowości. odnosi się do zmniejszenia liczby funkcji w zbiorze danych, a tym samym umożliwienia lepszego wstępnego przetwarzania danych. Modele zmiennych ukrytych są powszechnie używane do tego celu i są możliwe tylko dzięki zastosowaniu algorytmów uczenia nienadzorowanego.

Wzorce i trendy odkryte przy użyciu uczenia nienadzorowanego mogą się również przydać podczas późniejszego stosowania algorytmów uczenia nadzorowanego – na przykład uczenie nienadzorowane może pomóc w przeprowadzeniu analizy skupień na zbiorze danych, a następnie możesz zastosować uczenie nadzorowane na dowolnym wybranym klastrze/ potrzebować.
Inżynierowie uczenia maszynowego: mity a rzeczywistość

Podsumowując, uczenie maszynowe i sztuczna inteligencja to niezwykle złożone dziedziny, a każdy wyrafinowany system sztucznej inteligencji, z którym się spotkasz, najprawdopodobniej będzie wykorzystywał kombinację różnych algorytmów i mechanizmów uczenia się. Powiedziawszy to, jeśli jesteś początkującym, konieczne jest, abyś znał kluczowe punkty dotyczące wszystkich podstawowych technik uczenia się.

Ucz się kursów ML z najlepszych światowych uniwersytetów. Zdobywaj programy Masters, Executive PGP lub Advanced Certificate Programy, aby przyspieszyć swoją karierę.
Mamy nadzieję, że udało nam się wyjaśnić subtelniejsze punkty algorytmu uczenia nienadzorowanego. Jeśli masz wątpliwości, zostaw je w komentarzach poniżej!

Wspomnij o ograniczeniach nienadzorowanego uczenia maszynowego.

W przypadku nienadzorowanego uczenia maszynowego konieczna może być interwencja człowieka, aby uchwycić różne wzorce i powiązać je z wiedzą specjalistyczną w danej dziedzinie, co może być kosztowne. Wyniki lub ustalenia często okazują się niedokładne. Nie można dokładnie zdefiniować sortowania i wyprowadzania nienadzorowanego zadania. Jest w dużym stopniu zależny od modelu, a co za tym idzie od maszyny. Ponadto całkowita liczba kursów jest nieznana. W rezultacie wnioski z analizy są trudne do zweryfikowania.

Jaka jest zasada asocjacji w nienadzorowanym uczeniu maszynowym?

Zasada asocjacji jest jedną z kilku nienadzorowanych metod uczenia maszynowego. Możesz tworzyć relacje między elementami danych w ogromnych bazach danych za pomocą reguł asocjacji. Celem tego nienadzorowanego podejścia/algorytmu jest odkrycie intrygujących korelacji między zmiennymi w ogromnych bazach danych. Reguła asocjacji to zestaw podejść, które są wykorzystywane do oferowania doskonałej podstawy do generowania wszelkiego rodzaju prognoz i oceny prawdopodobieństwa wystąpienia pewnych zdarzeń w stosunku do innych.