Introducere în rețeaua neuronală recursiva: concept, principiu și implementare

Publicat: 2020-09-11

O rețea neuronală recursiva este un tip de rețea neuronală profundă. Deci, cu aceasta, vă puteți aștepta și obține o predicție structurată prin aplicarea aceluiași număr de seturi de ponderi pe intrările structurate. Cu acest tip de procesare, obțineți o rețea neuronală profundă tipică cunoscută sub numele de rețea neuronală recursivă . Aceste rețele sunt de natură neliniară.

Rețelele recursive sunt modele adaptive care sunt capabile să învețe erudiția profund structurată. Prin urmare, puteți spune că rețelele neuronale recursive se numără printre lanțurile inerente complexe. Să discutăm legătura sa cu conceptele de deep learning.

Sursă

Cuprins

Conceptul de învățare profundă

Sursă

Nu se poate nega faptul că Deep Learning este o tehnică uimitoare de învățare automată.

A învățat chiar și computerele cum să se comporte și să răspundă în mod natural, similar cu ceea ce ar trebui să facă o ființă umană; aceleași învățături sunt programate ipotetic în computere în zilele noastre. Prin urmare, ei trebuie să urmeze întotdeauna un exemplu și să învețe prin el. Deci, dacă cineva dorește să prezică orice lucru imprevizibil, acum este posibil prin Deep learning.

Mulți cercetători și chiar ingineri sunt destul de ocupați cu dezvoltarea inteligenței artificiale. Ei folosesc o combinație de rețele non-bio-neurale împreună cu inteligența naturală pentru a sorta toate soluțiile. Prin urmare, putem spune că acum Deep Learning merge aproape dincolo de învățarea automată. De fapt, de asemenea, împreună cu tehnicile sale de algoritmi, care sunt atât supravegheați, fie chiar nesupravegheați.

Multe straturi de unități de procesare neliniare sunt utilizate pentru aceste sarcini, cum ar fi extragerea de caracteristici și anumite transformări în Deep Learning. Aceasta a devenit o revoluție în industriile actuale, deoarece capacitățile sale demonstrative sunt foarte apropiate de cele ale capacităților și preciziei la nivel uman în majoritatea sarcinilor pe care le îndeplinește. Deci, dacă vorbim despre o sarcină cum ar fi recunoașterea modelelor sau dacă spunem o clasificare a imaginilor, nu numai aceasta, ci și includerea decodării vocii sau a textului sunt posibile și cu atâtea mai multe astfel de opțiuni cu algoritmi de învățare profundă.

Deep Learning se numără printre anumite tehnologii cheie din zilele noastre, care sunt foarte utilizate pentru a controla comenzile vocale pe dispozitive mobile, cum ar fi smartphone-uri, televizoare Android, difuzoare cu comandă vocală Alexa și multe alte dispozitive similare. Am introdus chiar și mașinile fără șofer prin tehnologia de deep learning. Acest lucru le-a permis să recunoască diferite procesări de imagini, cum ar fi semnele de oprire. De asemenea, i-a făcut să învețe să distingă chiar și imagini, cum ar fi un pieton care vine de la un stâlp îndepărtat.

Prin urmare, DL și-a făcut deja un nume în domenii precum procesarea imaginilor și clasificarea imaginilor. De asemenea, a recunoscut eficient vorbirea cu acuratețe ridicată. Prin urmare, dacă spunem că tehnologia de învățare profundă își deschide calea către o rată crucială de succes, nu ne vom înșela. A captat atenția tuturor ființelor vii cu o notație bună.

Și-a dovedit nenumărate potențialul obținând o mulțime de rezultate, ceea ce pare a fi imposibil mai devreme. Aici, liderii comunităților de afaceri și de dezvoltatori cunoscuți trebuie să se prezinte și să obțină o analiză amănunțită a potențialului său suplimentar de a scoate în evidență potența asupra a ceea ce poate face și modul în care NLP și învățarea profundă pot aduce beneficii oamenilor în toate domeniile.

Rețeaua neuronală recursivă

Sursă

Cu cuvinte simple, dacă spunem că o rețea neuronală recursiva este o persoană de familie a unei rețele neuronale profunde, o putem valida. Deci, dacă același set de ponderi este aplicat recursiv pe o intrare structurată, atunci rețeaua neuronală recursive va lua naștere. Deci, se va întâmpla în continuare pentru toate nodurile, așa cum s-a explicat mai sus. Rețelele neuronale recursive sunt realizate din clasă arhitecturală, care este în principal operațională pe intrări structurate. RNN-urile sunt în special direcționate pe grafice aciclice.

Este o structură de copac adâncă. Pentru condiții precum există nevoi de analiza a propoziției complete, sunt folosite rețele neuronale recursive. Are o topologie asemănătoare cu arborele. RNN-urile permit ramificarea conexiunilor și structurilor cu ierarhii.

Ei folosesc în principal rețele neuronale recursive pentru predicția rezultatelor structurate. Se realizează pe structuri de intrare de dimensiuni variabile. De asemenea, traversează o structură dată care, de asemenea, în ordine topologică. O fac și pentru predicții scalare. Dar aici trebuie remarcat faptul că rețeaua neuronală recursiva pur și simplu nu răspunde la intrările structurate, ci funcționează și în contexte.

Fiecare serie temporală este procesată separat. Un punct foarte interesant de luat în considerare este că prima introducere a RNN a avut loc atunci când a apărut nevoia de a învăța reprezentări de date distribuite ale diferitelor rețele structurale. De exemplu, termeni logici.

Rețele neuronale recurente vs. rețele neuronale recursive

Sursă

Conform surselor menționate în Wikipedia, rețeaua neuronală recurentă este o rețea neuronală recursivă. Ambele rețele neuronale sunt desemnate cu același acronim – RNN. Dacă rețelele neuronale sunt recurente într-o perioadă de timp sau spun că este un tip de lanț de rețea recursiv, este o rețea neuronală recurentă. Pentru a generaliza, aparține rețelei recursive.

Imaginea de mai sus prezintă rețeaua neuronală recursivă. Aici, dacă vedeți, veți descoperi că fiecare dintre nodurile părinte, copiii săi sunt un nod destul de asemănător cu nodul părinte. Prin urmare, este evident că rețeaua neuronală recurentă este mai asemănătoare cu un tip de rețea ierarhică. Puteți vedea clar că aici nu există un concept de procesare structurată de intrare și ieșire. Se realizează doar într-o manieră ierarhică asemănătoare arborelui, unde nu există specificații de timp și dependențe asociate.

Prin urmare, diferența majoră dintre rețelele neuronale recursive și rețelele neuronale recursive nu este în mod clar foarte bine definită. Se vede că eficiența oricărei rețele neuronale recursive este mult mai bună în comparație cu o rețea feed-forward. Rețelele neuronale recurente sunt create într-o structură asemănătoare lanțului. Nu există metode de ramificare, dar rețelele neuronale recurente sunt create sub forma unei structuri de arbore profunde.

Rețele neuronale recursive | Principiul definit

Deci, pentru a generaliza aici, rețelele recurente nu diferă de rețelele neuronale recursive. Dar, de fapt, este o rețea neuronală recursiva. Există un fapt legat de faptul că rețelele recursive sunt în mod inerent complexe și, prin urmare, nu sunt acceptate pe o platformă mai largă. Aceste RNN-uri sunt și mai scumpe la toate etapele și fazele de învățare computațională.

Puteți învăța aceste modele de calcul care se potrivesc foarte bine pentru probleme de clasificare și regresie. Înscrieți-vă astăzi la cursul online upGrad pentru a afla cum poate rezolva orice sarcini de învățare supravegheate sau nesupravegheate. Înscrie-te astăzi! Învățați de la experți în NLP și în învățare automată.

Implementarea rețelei neuronale recursive

Folosim o rețea neuronală recursiva pentru analiza sentimentelor în propoziții. Analiza sentimentelor propozițiilor se numără printre sarcinile majore ale NLP (Natural Language Processing), care poate identifica scriitorii care scriu tonul și sentimentele în orice propoziție specifică. Când un scriitor exprimă orice sentimente, sunt identificate etichetele de bază în jurul tonului scrisului. De exemplu, dacă sensul este o formă constructivă de scriere sau alegeri negative ale cuvintelor.

De exemplu, în cazul menționat mai jos al setului de date variabile, acesta exprimă fiecare emoție în clase distincte.

Sursă

Deci, dacă vedeți imaginea de mai sus pentru analiza Sentimentului, aceasta este complet implementată cu ajutorul algoritmilor de rețele neuronale recursive. RNN este o formă de rețea neuronală recursivă care are o structură arborescentă.

Concluzie

Sperăm că acest articol a clarificat câteva elemente de bază ale învățării profunde și algoritmilor de rețele neuronale recursive. Cunoașterea algoritmilor de învățare automată și a tipului acesteia poate ajuta pe oricine să înțeleagă cât de mult potențial are pentru revoluția viitoare.

Învățând algoritmi de limbaj de mașină, vă puteți face o idee despre procesarea computațională pe seturi de date, calitatea acestora în ciuda naturii și dimensiunilor lor. Prin dobândirea acestor învățăminte, se pot extrage informații mai relevante și utile dintr-un set de date folosit ca resursă utilă. Deci, mergeți înainte. Învață un algoritm de limbaj automat în acest sezon. Nu vă faceți griji; Vă asigurăm că nu vă va complica cunoștințele de bază privind codificarea sau termenii logici, dar vă va ajuta să îmbunătățiți toate specificațiile NPL.

Dacă sunteți interesat să aflați mai multe despre învățarea automată, consultați Diploma PG de la IIIT-B și upGrad în Învățare automată și AI, care este concepută pentru profesioniști care lucrează și oferă peste 450 de ore de pregătire riguroasă, peste 30 de studii de caz și sarcini, IIIT- B Statut de absolvenți, peste 5 proiecte practice practice și asistență pentru locuri de muncă cu firme de top.

Pentru ce sunt folosite rețelele neuronale recursive?

Rețelele neuronale recursive sunt un fel de rețea de învățare profundă. Ele sunt mai generale și mai puternice decât rețelele neuronale feedforward. Cuvântul recursiv înseamnă că rețeaua neuronală este aplicată la propria sa ieșire. Rețelele neuronale recurente sunt folosite pentru problemele de etichetare a secvenței. Ele sunt concepute pentru a recunoaște modele din datele care transportă informații din trecut. Cu alte cuvinte, rețeaua neuronală recursivă învață din trecut și prelucrează date noi pe baza experienței. Rețeaua neuronală recursivă folosește algoritmi de învățare pentru a determina cum să facă modificările adecvate în viitor.

Care este diferența dintre CNN și RNN?

CNN înseamnă Rețea neuronală convoluțională. CNN este un tip special de rețea neuronală capabilă să preia date secvențiale și să înțeleagă modele. CNN-urile sunt de obicei folosite pentru recunoașterea imaginilor, dar au fost folosite în probleme la fel de complexe precum generarea de limbaj din date neetichetate. Puteți citi mai multe despre CNN aici. RNN reprezintă rețeaua neuronală recurentă. RNN-urile sunt foarte asemănătoare cu rețelele neuronale obișnuite, cu excepția faptului că au o memorie încorporată, un fel ca o buclă. Ele pot fi folosite pentru a modela secvențe precum limbajul sau datele text. La fel ca CNN-urile, există multe tipuri diferite de RNN, dar LSTM-urile sunt unul dintre cele mai populare.

De ce este folosit RNN pentru traducerea automată?

Rețelele neuronale recurente (RNN) sunt utilizate în traducerea automată, deoarece captează rezultatul viitor, având în vedere o secvență de intrări. De exemplu, cuvântul „rundog” fără contextul trecut, nu are sens. RNN-urile captează acest context și traduc câine în canin. Fără RNN, traducătorii automati nu pot face inferențe despre intrare. Acesta este motivul pentru care sunt utilizate RNN.