Rodzaje algorytmów sztucznej inteligencji, które powinieneś znać [Kompletny przewodnik]

Opublikowany: 2019-11-13

Sztuczna inteligencja urosła, aby mieć znaczący wpływ na świat. Dzięki dużej ilości danych generowanych przez różne aplikacje i źródła systemy uczenia maszynowego mogą uczyć się na podstawie danych testowych i wykonywać inteligentne zadania.

Sztuczna inteligencja to dziedzina informatyki, która zajmuje się nadawaniem maszynom zdolności decyzyjnych i zdolności myślenia. Sztuczna inteligencja jest zatem mieszanką informatyki, analizy danych i czystej matematyki.

Uczenie maszynowe staje się integralną częścią Sztucznej Inteligencji i zajmuje się tylko pierwszą częścią, procesem uczenia się z danych wejściowych. Sztuczna inteligencja i jej zalety nigdy nie przestały nas zadziwiać.

Dołącz do internetowych kursów AI z najlepszych światowych uniwersytetów — studiów magisterskich, programów podyplomowych dla kadry kierowniczej oraz zaawansowanego programu certyfikacji w zakresie uczenia maszynowego i sztucznej inteligencji, aby przyspieszyć swoją karierę.

Spis treści

Rodzaje algorytmów sztucznej inteligencji
- 1. Algorytmy klasyfikacji
  - a) Naiwny Bayes
  - b) Drzewo decyzyjne
  - c) Losowy las
  - d) Wsparcie maszyn wektorowych
  - e) K Najbliżsi sąsiedzi
- 2. Algorytmy regresji
  - a) Regresja liniowa
  - b) Regresja Lasso
  - c) Regresja logistyczna
  - d) Regresja wielowymiarowa
  - e) Algorytm regresji wielokrotnej
- 3. Algorytmy klastrowania
  - a) Klastrowanie K-średnich
  - b) Algorytm rozmytych C-średnich
  - c) Algorytm maksymalizacji oczekiwań (EM)
  - d) Hierarchiczny algorytm grupowania
Zakończmy i zakończmy
Co to są naiwne bajki?
Czym jest drzewo decyzyjne?
Co to jest maszyna wektorów nośnych?

Rodzaje algorytmów sztucznej inteligencji

Algorytmy sztucznej inteligencji można ogólnie sklasyfikować jako:

1. Algorytmy klasyfikacji

Algorytmy klasyfikacji są częścią uczenia nadzorowanego. Algorytmy te służą do dzielenia badanej zmiennej na różne klasy, a następnie przewidywania klasy dla danego wejścia. Na przykład algorytmy klasyfikacji mogą służyć do klasyfikowania wiadomości e-mail jako spamu lub nie. Omówmy niektóre z powszechnie stosowanych algorytmów klasyfikacji.

a) Naiwny Bayes

Naiwny algorytm Bayesa działa na twierdzeniu Bayesa i przyjmuje podejście probabilistyczne, w przeciwieństwie do innych algorytmów klasyfikacji. Algorytm ma zestaw wcześniejszych prawdopodobieństw dla każdej klasy. Po wprowadzeniu danych algorytm aktualizuje te prawdopodobieństwa, tworząc coś znanego jako prawdopodobieństwo a posteriori. Jest to przydatne, gdy trzeba przewidzieć, czy dane wejściowe należą do określonej listy klas, czy nie.

b) Drzewo decyzyjne

Algorytm drzewa decyzyjnego jest bardziej schematem blokowym podobnym do algorytmu, w którym węzły reprezentują test na atrybucie wejściowym, a gałęzie reprezentują wynik testu.

c) Losowy las

Losowy las działa jak grupa drzew. Zbiór danych wejściowych jest dzielony i wprowadzany do różnych drzew decyzyjnych. Uwzględniana jest średnia wyników ze wszystkich drzew decyzyjnych. Lasy losowe oferują dokładniejszy klasyfikator w porównaniu z algorytmem drzewa decyzyjnego.

d) Wsparcie maszyn wektorowych

SVM to algorytm, który klasyfikuje dane za pomocą hiperpłaszczyzny, upewniając się, że odległość między hiperpłaszczyzną a wektorami nośnymi jest maksymalna.

e) K Najbliżsi sąsiedzi

Algorytm KNN wykorzystuje kilka punktów danych podzielonych na klasy, aby przewidzieć klasę nowego przykładowego punktu danych. Nazywa się to „algorytmem leniwego uczenia się”, ponieważ jest stosunkowo krótki w porównaniu z innymi algorytmami.

2. Algorytmy regresji

Algorytmy regresji są popularnym algorytmem w nadzorowanych algorytmach uczenia maszynowego. Algorytmy regresji mogą przewidywać wartości wyjściowe na podstawie wejściowych punktów danych wprowadzonych do systemu uczącego. Główne zastosowanie algorytmów regresji obejmuje przewidywanie ceny giełdowej, przewidywanie pogody itp. Najczęstsze algorytmy w tej sekcji to

a) Regresja liniowa

Służy do pomiaru autentycznych cech poprzez rozważenie spójnych zmiennych. Jest to najprostszy ze wszystkich algorytmów regresji, ale może być zaimplementowany tylko w przypadku zależności liniowej lub problemu liniowo separowanego. Algorytm rysuje linię prostą między punktami danych zwaną linią najlepszego dopasowania lub linią regresji i służy do przewidywania nowych wartości.

Przeczytaj: Regresja liniowa – pytania i odpowiedzi na wywiad ML

b) Regresja Lasso

Algorytm regresji Lasso działa poprzez uzyskanie podzbioru predyktorów, który minimalizuje błąd predykcji dla zmiennej odpowiedzi. Osiąga się to poprzez nałożenie ograniczenia na punkty danych i umożliwienie niektórym z nich zmniejszenia się do wartości zerowej.

c) Regresja logistyczna

Regresja logistyczna jest używana głównie do klasyfikacji binarnej. Ta metoda pozwala na analizę zestawu zmiennych i przewidzenie wyniku kategorycznego. Jego główne zastosowania obejmują przewidywanie wartości życiowej klienta, wartości domu itp.

d) Regresja wielowymiarowa

Ten algorytm musi być używany, gdy istnieje więcej niż jedna zmienna predykcyjna. Algorytm ten jest szeroko stosowany w silnikach rekomendacji produktów w sektorze detalicznym, gdzie preferowane przez klientów produkty będą zależeć od wielu czynników, takich jak marka, jakość, cena, recenzja itp.

e) Algorytm regresji wielokrotnej

Algorytm regresji wielokrotnej wykorzystuje kombinację algorytmów regresji liniowej i nieliniowej, przyjmując jako dane wejściowe wiele zmiennych objaśniających. Główne zastosowania obejmują badania w naukach społecznych, autentyczność roszczeń ubezpieczeniowych, analizę behawioralną itp.

3. Algorytmy klastrowania

Grupowanie to proces segregowania i organizowania punktów danych w grupy na podstawie podobieństw w obrębie członków grupy. Jest to część uczenia się bez nadzoru. Głównym celem jest pogrupowanie podobnych pozycji. Na przykład może zaaranżować razem wszystkie transakcje o charakterze oszukańczym w oparciu o niektóre właściwości transakcji. Poniżej znajdują się najpopularniejsze algorytmy klastrowania.

a) Klastrowanie K-średnich

Jest to najprostszy algorytm uczenia nienadzorowanego. Algorytm zbiera razem podobne punkty danych, a następnie łączy je w klaster. Grupowanie odbywa się poprzez obliczenie środka ciężkości grupy punktów danych, a następnie ocenę odległości każdego punktu danych od środka ciężkości skupienia. Na podstawie odległości analizowany punkt danych jest następnie przypisywany do najbliższego klastra. „K” w K-średnich oznacza liczbę klastrów, w które pogrupowane są punkty danych.

b) Algorytm rozmytych C-średnich

Algorytm FCM działa na prawdopodobieństwie. Uważa się, że każdy punkt danych ma prawdopodobieństwo przynależności do innego klastra. Punkty danych nie mają bezwzględnego członkostwa w określonym klastrze i dlatego algorytm nazywa się rozmytym.

c) Algorytm maksymalizacji oczekiwań (EM)

Opiera się na rozkładzie Gaussa, którego nauczyliśmy się w statystykach. Dane są przedstawiane w modelu rozkładu Gaussa w celu rozwiązania problemu. Po przypisaniu prawdopodobieństwa wyliczana jest próbka punktowa na podstawie równań oczekiwań i maksymalizacji.

d) Hierarchiczny algorytm grupowania

Algorytmy te sortują klastry w kolejności hierarchicznej po poznaniu punktów danych i dokonaniu obserwacji podobieństwa. Może być dwojakiego rodzaju

Grupowanie z podziałem dla podejścia odgórnego
Grupowanie aglomeracyjne dla podejścia oddolnego

Zakończmy i zakończmy

Sztuczna inteligencja wielokrotnie zaskakiwała świat i ma wiele zastosowań w świecie rzeczywistym do rozwiązywania złożonych problemów. Mamy nadzieję, że ten artykuł rzucił nieco światła na różne algorytmy sztucznej inteligencji i ich szeroką klasyfikację. Algorytmy są wybierane w zależności od potrzeb i charakteru posiadanych przez nas punktów danych.

Algorytmy mają swoje zalety i wady pod względem dokładności, wydajności i czasu przetwarzania. To tylko kilka algorytmów. Jeśli chcesz dowiedzieć się więcej, zapoznaj się z programem Executive PG UpGrad i IIIT-B w dziedzinie uczenia maszynowego i sztucznej inteligencji .

Co to są naiwne bajki?

Twierdzenie Bayesa jest używane w algorytmie naiwnym Bayesa, który w przeciwieństwie do innych algorytmów z tej listy przyjmuje podejście probabilistyczne. Oznacza to po prostu, że metoda ma zestaw wcześniejszych prawdopodobieństw ustalonych dla każdej klasyfikacji dla celu, zamiast przeskakiwać bezpośrednio do danych. Algorytm zmienia te wcześniejsze prawdopodobieństwa, aby wygenerować prawdopodobieństwo a posteriori, gdy wprowadzasz dane. W rezultacie może to być niezwykle korzystne w sytuacjach, gdy musisz przewidzieć, czy dane wejściowe odpowiadają jednej z n klas, czy żadnej z nich. Jest to wykonalne przy użyciu techniki probabilistycznej, ponieważ prawdopodobieństwa rzucone dla wszystkich n klas będą dość niskie.

Czym jest drzewo decyzyjne?

Drzewo decyzyjne jest po prostu strukturą przypominającą schemat blokowy, w której każdy węzeł zewnętrzny reprezentuje próbę atrybutu, a każda gałąź wskazuje wynik testu. Oczekiwane etykiety są przechowywane w węzłach liści. Zaczynamy od korzenia drzewa i przechodzimy do węzła liścia, porównując wartości atrybutów. Kiedy mamy do czynienia z danymi wielowymiarowymi i przy niewielkiej ilości czasu poświęconego na przygotowanie danych, używamy tego klasyfikatora. Słowo ostrzeżenia: są one podatne na nadmierne dopasowanie i mogą się znacznie różnić nawet przy niewielkich zmianach danych treningowych.

Co to jest maszyna wektorów nośnych?

W zakresie, w jakim próbuje posortować punkty danych z marginesami między dwiema klasami tak szerokimi, jak to możliwe, SVM jest wyjątkowa. Nazywa się to maksymalną separacją marginesów. Inną kwestią, o której należy pamiętać, jest to, że w przeciwieństwie do regresji liniowej, SVM wykreślają hiperpłaszczyznę przy użyciu tylko wektorów pomocniczych, podczas gdy regresja liniowa wykorzystuje pełny zestaw danych. Maszyny SVM są szczególnie przydatne w sytuacjach, gdy dane mają wiele wymiarów. Zaczynasz więc od wygenerowania losowej hiperpłaszczyzny, a następnie pomiaru odległości między nią a najbliższymi wartościami danych z każdej klasy. Wektory nośne to punkty danych znajdujące się najbliżej hiperpłaszczyzny.