Cele mai importante tipuri de modele de învățare profundă pe care inginerii AI ar trebui să învețe în 2022

Publicat: 2021-01-01

Cuprins

Introducere

Deep Learning este o tehnică de învățare automată care valorifică diferite straturi de procesare neliniară a informațiilor pentru transformarea nesupravegheată și supravegheată, extragerea caracteristicilor, clasificarea și analiza modelelor.

Când vine vorba de procesarea informației într-o manieră neliniară, aceasta constă din diferite straturi ierarhice. Aici, unele concepte de nivel scăzut sunt capabile să definească concepte de nivel superior. Învățarea supravegheată este o formă de învățare automată, un set de instruire, iar un set de exemple sunt transmise ca intrare în sistem în timpul fazei de instruire.

Deoarece fiecare intrare este etichetată cu o valoare de ieșire, sistemul cunoaște ieșirea atunci când este furnizat un set de intrări. Pe de altă parte, în învățarea nesupravegheată, intrările nu sunt etichetate cu clasa căreia îi aparține. Prin urmare, este la latitudinea sistemului să dezvolte și să organizeze datele prin căutarea caracteristicilor comune și efectuând modificările necesare pe baza cunoștințelor interne.

Rețelele neuronale artificiale sunt superficiale. Astfel, ei nu se pot ocupa de date complexe, așa cum se găsesc în aplicațiile de zi cu zi, cum ar fi imaginile, vorbirea naturală, regăsirea informațiilor și aplicațiile de procesare a informațiilor de tip uman. Pentru aceste tipuri de aplicații, modelele de deep learning sunt perfecte. Cu ajutorul învățării profunde, este posibilă clasificarea, recunoașterea și clasificarea tiparelor de date pentru o mașină cu mai puțin efort.

Articol înrudit: Top tehnici de învățare profundă

Tipuri de modele de învățare profundă

Modelele de învățare profundă au evoluat, iar cele mai multe dintre ele se bazează pe rețele neuronale artificiale. Cele mai semnificative dintre ele sunt rețelele neuronale convoluționale (CNN). De asemenea, include variabile latente și formule propoziționale organizate pe straturi în modele generative profunde.

Autoencodere

Este o rețea neuronală artificială, care poate învăța din diferite modele de codare. Un autoencoder este similar cu un perceptron multistrat având un strat de intrare, un strat ascuns sau un strat de ieșire în cea mai simplă formă. Stratul de ieșire are același număr de noduri ca un strat de ieșire. Nu prezice valorile țintă pe baza vectorului de ieșire; în schimb, codificatorul automat își poate prezice intrarea. Acest mecanism de învățare poate fi subliniat după cum urmează:

Pentru fiecare intrare x,

Calculați activarea lăsând un feedforward să treacă la fiecare strat ascuns și layer-ul de ieșire
Utilizați funcțiile de eroare adecvate pentru detectarea abaterii dintre valorile calculate
Actualizați ponderile prin propagarea inversă a erorii
Continuați să repetați sarcina până când generează rezultate satisfăcătoare

Dacă stratul ascuns are mai puține noduri decât nodurile de intrare-ieșire, atunci activarea ultimului strat ascuns este considerată ca o reprezentare comprimată a intrărilor. Dacă nodurile de strat ascunse sunt mai multe ca număr, un autoencoder va învăța funcția de identitate și se va dovedi inutil în majoritatea cazurilor.

Deep Belief Net

Oferă o soluție pentru gestionarea minimelor locale și a funcțiilor obiective neconvexe care posedă perceptron multistrat tipic. Vă puteți gândi la el ca un tip alternativ de învățare profundă care constă din mai multe straturi de variabile latente interconectate cu alte straturi. Este o versiune restricționată a mașinilor Boltzmann.

Aici, straturile ascunse ale fiecărei subrețele vor servi drept strat de intrare vizibil pentru stratul adiacent al rețelei. Astfel, face din stratul vizibil cel mai de jos un set de antrenament pentru stratul adiacent al rețelei. Prin urmare, fiecare strat al rețelei poate fi antrenat cu lăcomie și independent. Fiecare strat al structurii profunde utilizează variabile ascunse ca variabile observate pentru antrenarea fiecărui strat al structurii profunde. Algoritmul pentru antrenarea unei rețele de credință profundă este următorul:

Luați în considerare vectorii de intrare
Utilizați vectorul de intrare pentru antrenamentul unei mașini Boltzmann și obțineți matricea de greutate
Utilizați matricea de greutate pentru antrenamentul a două straturi inferioare ale rețelei
Utilizați RBM de rețea pentru a genera un nou vector de intrare prin activarea medie și eșantionarea unităților ascunse.
Continuați să repetați procedura până când ajungeți la primele două straturi ale rețelei.

Citește și: Deep Learning vs Neural Networks

Rețele neuronale convoluționale (CNN)

Este o altă variantă a perceptronului multistrat bazat pe feedforward. Acesta organizează neuronii individuali astfel încât să răspundă la toate regiunile suprapuse din zona vizuală. Este unul dintre algoritmii de învățare profundă capabili să preia o imagine de intrare și să acorde importanță părtinirilor și ponderilor care pot fi învățate ale diferitelor aspecte/obiecte din imagine.

Se poate diferenția unul de celălalt. Nevoia de preprocesare în CNN este destul de scăzută în comparație cu alți algoritmi de clasificare. CNN are capacitatea de a învăța aceste caracteristici și filtre.

CNN-urile sunt una dintre principalele categorii pentru următoarele:

Detectarea obiectelor

Clasificări de imagini

Recunoașterea imaginilor

Recunoașterea feței etc.

Acestea sunt câteva dintre puținele domenii în care CNN poate fi utilizat pe scară largă.

Pentru clasificarea imaginilor, CNN va accepta o imagine de intrare, o va procesa și va face clasificarea în diferite categorii. Calculatoarele vizualizează imaginile de intrare ca o matrice de pixeli și este o variabilă a rezoluției imaginii. Din punct de vedere tehnic, modelele CNN vor supune fiecare imagine de intrare prin mai multe straturi convoluționale cu filtre pentru antrenament și testare.

Primul strat este cunoscut sub numele de Convoluție, care este atribuit pentru a extrage caracteristici dintr-o imagine de intrare. Convoluția poate păstra relațiile dintre pixeli, deoarece poate învăța caracteristicile imaginii prin utilizarea unor pătrate mici de date de intrare. Execută o operație matematică luând două intrări: o matrice de imagine și un filtru sau nucleu.

Atunci când o convoluție de imagine este prevăzută cu filtre diferite, aceasta va deveni capabilă să efectueze operațiuni precum detectarea marginilor, clarificarea și estomparea prin filtre.

În ultimii câțiva ani, domeniul viziunii computerizate a înregistrat progrese considerabile. Una dintre cele mai mari progrese este CNN. CNN-urile profunde au evoluat pentru a deveni cele mai fantezite aplicații de viziune computerizată utilizate în recunoașterea gesturilor, mașinile cu conducere autonomă, etichetarea automată a prietenilor în imaginile postate pe Facebook, funcțiile de securitate facială și recunoașterea automată a plăcuțelor de înmatriculare.

Rețele neuronale recurente

Este un tip de rețea neuronală în care rezultatul pasului anterior poate fi alimentat ca intrare în pasul curent. Intrările și ieșirile dintr-o rețea neuronală convențională sunt independente unele de altele. Cu toate acestea, în cazurile în care este nevoie de a prezice cuvintele succesive dintr-o propoziție, va fi nevoie de amintirea cuvintelor anterioare.

Apariția RNN promite să rezolve această problemă cu ajutorul unui strat ascuns. Una dintre caracteristicile cheie ale RNN este starea ascunsă capabilă să-și amintească unele informații într-o secvență.

RNN este echipat cu o memorie care poate reține toate informațiile despre calcule. Poate folosi aceiași parametri pentru fiecare intrare pentru a efectua aceleași sarcini pe toate intrările sau straturi ascunse pentru a produce rezultatul dorit. Va reduce foarte mult complexitatea parametrilor, ceea ce este în contrast puternic cu alte rețele neuronale.

Gânduri finale

Calculul gradienților depinde nu numai de pasul curent, ci și de pasul anterior. Există o variantă numită rețea neuronală recurentă bidirecțională care este utilizată de mai multe aplicații. Aici, rețeaua ia în considerare rezultatele anterioare și viitoare așteptate. Prin introducerea mai multor straturi ascunse, învățarea profundă poate fi realizată în rețele neuronale recurente, directe, bidirecționale.

Dacă sunteți interesat să aflați mai multe despre tehnicile de învățare profundă , învățarea automată, consultați Certificarea PG de la IIIT-B și upGrad în învățare automată și învățare profundă, care este concepută pentru profesioniști care lucrează și oferă peste 240 de ore de formare riguroasă, peste 5 studii de caz & misiuni, statutul de absolvenți IIIT-B și asistență la locul de muncă cu firme de top.

Conduceți revoluția tehnologică condusă de inteligența artificială

PG DIPLOMĂ ÎN ÎNVĂŢAREA MACHINĂ ŞI INTELIGENTĂ ARTIFICIALĂ

Aflați mai multe