Tipuri de algoritmi de inteligență artificială pe care ar trebui să-i cunoașteți [un ghid complet]

Publicat: 2019-11-13

Inteligența artificială a crescut pentru a avea un impact semnificativ asupra lumii. Cu cantități mari de date generate de diferite aplicații și surse, sistemele de învățare automată pot învăța din datele de testare și pot efectua sarcini inteligente.

Inteligența artificială este domeniul informaticii care se ocupă cu transmiterea abilității decisive și a capacității de gândire la mașini. Inteligența artificială este astfel un amestec de informatică, analiză a datelor și matematică pură.

Învățarea automată devine o parte integrantă a inteligenței artificiale și se ocupă doar de prima parte, procesul de învățare din datele de intrare. Inteligența artificială și beneficiile ei nu au încetat să ne uimească.

Alăturați-vă cursurilor de inteligență artificială online de la cele mai bune universități din lume – masterat, programe executive postuniversitare și program de certificat avansat în ML și AI pentru a vă accelera cariera.

Cuprins

Tipuri de algoritmi de inteligență artificială

Algoritmii de inteligență artificială pot fi clasificați în linii mari ca:

1. Algoritmi de clasificare

Algoritmii de clasificare fac parte din învățarea supravegheată. Acești algoritmi sunt utilizați pentru a împărți variabila supusă în diferite clase și apoi pentru a prezice clasa pentru o intrare dată. De exemplu, algoritmii de clasificare pot fi utilizați pentru a clasifica e-mailurile ca spam sau nu. Să discutăm despre unii dintre algoritmii de clasificare folosiți în mod obișnuit.

a) Bayes naiv

Algoritmul naiv Bayes funcționează pe teorema Bayes și are o abordare probabilistică, spre deosebire de alți algoritmi de clasificare. Algoritmul are un set de probabilități anterioare pentru fiecare clasă. Odată ce datele sunt furnizate, algoritmul actualizează aceste probabilități pentru a forma ceva cunoscut sub numele de probabilitate posterioară. Acest lucru este util atunci când trebuie să preziceți dacă intrarea aparține unei anumite liste de clase sau nu.

b) Arborele decizional

Algoritmul arborelui de decizie este mai mult o diagramă de flux ca un algoritm în care nodurile reprezintă testul pe un atribut de intrare și ramurile reprezintă rezultatul testului.

c) Pădurea aleatorie

Pădurea întâmplătoare funcționează ca un grup de copaci. Setul de date de intrare este subdivizat și alimentat în arbori de decizie diferiți. Se ia în considerare media rezultatelor din toți arborii de decizie. Pădurile aleatorii oferă un clasificator mai precis în comparație cu algoritmul arborelui de decizie.

d) Suport Vector Machines

SVM este un algoritm care clasifică datele folosind un hiperplan, asigurându-se că distanța dintre hiperplan și vectorii suport este maximă.

e) K Cei mai apropiati vecini

Algoritmul KNN utilizează o mulțime de puncte de date separate în clase pentru a prezice clasa unui nou punct de date eșantion. Se numește „algoritm de învățare leneș”, deoarece este relativ scurt în comparație cu alți algoritmi.

2. Algoritmi de regresie

Algoritmii de regresie sunt un algoritm popular sub algoritmi de învățare automată supravegheați. Algoritmii de regresie pot prezice valorile de ieșire pe baza punctelor de date de intrare alimentate în sistemul de învățare. Aplicația principală a algoritmilor de regresie include prezicerea prețului bursier, prognozarea vremii etc. Cei mai obișnuiți algoritmi din această secțiune sunt

a) Regresia liniară

Este folosit pentru a măsura calitățile autentice luând în considerare variabilele consistente. Este cel mai simplu dintre toți algoritmii de regresie, dar poate fi implementat numai în cazuri de relație liniară sau o problemă separabilă liniar. Algoritmul trasează o linie dreaptă între punctele de date numită linie de cea mai bună potrivire sau linie de regresie și este folosit pentru a prezice noi valori.

Citiți: Regresia liniară – Întrebări și răspunsuri la interviu ML

b) Regresia Lasso

Algoritmul de regresie lasso funcționează prin obținerea subsetului de predictori care minimizează eroarea de predicție pentru o variabilă de răspuns. Acest lucru se realizează prin impunerea unei constrângeri asupra punctelor de date și permițând unora dintre ele să se micșoreze la valoarea zero.

c) Regresia logistică

Regresia logistică este utilizată în principal pentru clasificarea binară. Această metodă vă permite să analizați un set de variabile și să preziceți un rezultat categoric. Aplicațiile sale principale includ estimarea valorii pe durata de viață a clienților, valorile casei etc

d) Regresie multivariată

Acest algoritm trebuie utilizat atunci când există mai multe variabile predictoare. Acest algoritm este utilizat pe scară largă în motoarele de recomandare a produselor din sectorul retail, unde produsele preferate de clienți vor depinde de mai mulți factori, cum ar fi marca, calitatea, prețul, recenzia etc.

e) Algoritmul de regresie multiplă

Algoritmul de regresie multiplă folosește o combinație de regresie liniară și algoritmi de regresie neliniară care iau mai multe variabile explicative ca intrări. Principalele aplicații includ cercetarea în științe sociale, autenticitatea cererilor de asigurare, analiza comportamentală etc.

3. Algoritmi de clusterizare

Clustering este procesul de segregare și organizare a punctelor de date în grupuri pe baza asemănărilor din cadrul membrilor grupului. Aceasta face parte din învățarea nesupravegheată. Scopul principal este de a grupa articole similare. De exemplu, poate aranja toate tranzacțiile de natură frauduloasă împreună pe baza unor proprietăți din tranzacție. Mai jos sunt cei mai comuni algoritmi de grupare.

a) K-Means Clustering

Este cel mai simplu algoritm de învățare nesupravegheată. Algoritmul adună puncte de date similare împreună și apoi le leagă într-un cluster. Gruparea se face prin calcularea centroidul grupului de puncte de date și apoi evaluând distanța fiecărui punct de date față de centroidul clusterului. Pe baza distanței, punctul de date analizat este apoi atribuit celui mai apropiat cluster. „K” în K înseamnă numărul de grupuri în care punctele de date sunt grupate.

b) Fuzzy C-means Algoritm

Algoritmul FCM funcționează pe probabilitate. Fiecare punct de date este considerat a avea o probabilitate de a aparține unui alt cluster. Punctele de date nu au o apartenență absolută la un anumit cluster și de aceea algoritmul este numit fuzzy.

c) Algoritmul de așteptare-maximizare (EM).

Se bazează pe distribuția Gaussiană pe care am învățat-o în statistică. Datele sunt prezentate într-un model de distribuție gaussian pentru a rezolva problema. După atribuirea unei probabilități, un eșantion punctual este calculat pe baza ecuațiilor de așteptare și de maximizare.

d) Algoritmul de grupare ierarhică

Acești algoritmi sortează clusterele în ordine ierarhică după ce au învățat punctele de date și au făcut observații de similaritate. Poate fi de două tipuri

  • Clustering divizibil, pentru o abordare de sus în jos
  • Gruparea aglomerativă, pentru o abordare de jos în sus

Să încheiem și să încheiem

AI a surprins lumea de mai multe ori și are o mulțime de aplicații în lumea reală pentru a-și rezolva problemele complexe. Sperăm că acest articol a aruncat puțină lumină asupra diferiților algoritmi de inteligență artificială și a clasificărilor lor largi. Algoritmii sunt aleși în funcție de necesitatea și natura punctelor de date pe care le avem.

Algoritmii au avantajele și dezavantajele lor în ceea ce privește acuratețea, performanța și timpul de procesare. Aceștia sunt doar câțiva algoritmi. Dacă doriți să aflați mai multe, consultați programul Executive PG al upGrad și IIIT-B în Învățare automată și AI .

Ce este bayes naiv?

Teorema Bayes este folosită în algoritmul Naive Bayes, care, spre deosebire de ceilalți algoritmi din această listă, adoptă o abordare probabilistică. Aceasta înseamnă pur și simplu că metoda are un set de probabilități anterioare stabilite pentru fiecare dintre clasificările pentru ținta dvs., mai degrabă decât să sară direct în date. Algoritmul modifică aceste probabilități anterioare pentru a genera probabilitatea posterioară atunci când introduceți datele. Ca rezultat, acest lucru poate fi incredibil de benefic în situațiile în care trebuie să anticipați dacă intrarea dvs. corespunde uneia dintre n clase sau nici uneia dintre ele. Acest lucru este realizabil folosind o tehnică probabilistică, deoarece probabilitățile aruncate pentru toate clasele n vor fi destul de scăzute.

Ce este un arbore de decizie?

Arborele de decizie este pur și simplu o structură arborescentă asemănătoare unei organigrame în care fiecare nod exterior reprezintă o încercare pe un atribut și fiecare ramură indică rezultatul testului. Etichetele așteptate sunt stocate în nodurile frunzelor. Începem de la rădăcina arborelui și ne îndreptăm către nodul frunzelor comparând valorile atributelor. Când avem de-a face cu date cu dimensiuni mari și cu puțin timp petrecut cu pregătirea datelor, folosim acest clasificator. Cu toate acestea, un cuvânt de precauție: sunt predispuși la supraadaptare și pot varia dramatic chiar și cu mici modificări ale datelor de antrenament.

Ce este o mașină vectorială de suport?

În măsura în care încearcă să sorteze punctele de date cu marginile dintre două clase cât mai largi posibil, un SVM este unic. Aceasta este denumită separarea maximă a marjei. Un alt punct de reținut este că, spre deosebire de regresia liniară, SVM-urile trasează hiperplanul folosind doar vectorii suport, în timp ce regresia liniară folosește setul de date complet. SVM-urile sunt deosebit de benefice în circumstanțe în care datele au multe dimensiuni. Deci, începeți prin a genera un hiperplan aleatoriu, apoi măsurați distanța dintre acesta și cele mai apropiate valori de date din fiecare clasă. Vectorii suport sunt punctele de date care sunt cele mai apropiate de hiperplan.