Rețele neuronale convoluționale: Ghid definitiv pentru începători în 2022

Publicat: 2021-01-05

O căutare rapidă pe Google a „științei datelor” va dezvălui fără ambiguitate oricui cum
domeniul a devenit popular în ultimii cinci ani. Alături de știința datelor, artificială
inteligența, învățarea automată și învățarea profundă fac, de asemenea, runde populare
domeniul informaticii. Cel mai recent adăugat la această listă este neuronal convoluțional
rețele — o inovație din domeniul viziunii computerizate.

Cuprins

De unde a început totul?

Rețelele neuronale au devenit de fapt un succes în 2012, când Alex Krizhevsky a câștigat premiul
Concursul ImageNet din acel an. Această competiție este asemănătoare Jocurilor Olimpice de calculator
vederea și când Alex le-a folosit, eroarea de clasificare a scăzut de la 26% la 15%.

Aceasta a fost Raza laser inconfundabilă a speranței pe care companiile și computerul
oamenii de știință au nevoie. De atunci, companii precum Instagram, Facebook, Pinterest etc.
au implementat cu entuziasm rețele neuronale pentru a oferi cea mai bună experiență
publicul lor. Citiți: Tutorial pentru rețeaua neuronală.

Conexiunea biologică a rețelelor neuronale convoluționale va ajuta și la realizarea acesteia
fundația clară. În 1962, Hubel și Wiesel au arătat că neuroni diferiți din
cortexul vizual s-a declanșat numai atunci când au fost prezente indicii vizuale specifice. Împreună, acestea
neuronii aveau o structură columnară și, atunci când erau declanșați, produceau colectiv vizual
percepţie.

De exemplu, unii neuroni s-au declanșat doar atunci când au fost expuși la margini orizontale.
Alții au tras în prezența marginilor verticale sau diagonale. Astfel, diferiți neuroni
a răspuns la diferite componente vizuale și ne-a permis să vedem.

Ce este o rețea neuronală convoluțională?

O rețea neuronală convoluțională, numită și CNN sau ConvNet, este o învățare profundă
algoritm. Preia o imagine de intrare, atribuie ponderi/prejudecăți componentelor
imagine, apoi clasifică întreaga imagine. Cu suficientă pregătire, ConvNet-urile sunt
capabil să învețe filtre/clasificare iar preprocesarea necesară este mai mică ca
comparativ cu alți algoritmi. Citiți despre diferențele dintre deep learning și rețelele neuronale.

Ceea ce vrem să facă în cele din urmă o rețea neuronală convoluțională este să diferențiem
între imagini și clasificați-le corect. Este capabil să surprindă atât temporal, cât și
dependențe spațiale din cauza aplicării filtrelor relevante.

Bazele modului în care funcționează

Imaginea devine o matrice în funcție de rezoluția și dimensiunea imaginii.

Fiecare intrare din matrice va consta dintr-un număr de la 0 la 255 (dacă sistemul RGB este
folosit). Acest număr va reprezenta intensitatea pixelilor în acel punct.

Luând ca intrare toate aceste numere, computerul va scoate un număr. Acest număr
va semnifica probabilitatea ca o imagine să aparțină unei anumite clase (de exemplu, casă,
drum, autobuz, câine, pisică etc.)

Structura unui CNN

Văzând imaginea de mai sus, ați putea crede că există o mulțime de straturi într-un convoluțional
rețea neuronală, dar, în realitate, există doar 3 mari. Acestea includ:
1. Stratul convoluțional
2. Stratul de pooling
3. Stratul complet conectat
Să ne aprofundăm în fiecare dintre acestea.

Stratul convoluțional

Acesta este stratul de bază al rețelei neuronale convoluționale. Parametrii săi sunt
compus dintr-un set de filtre. Aceste filtre sunt mici, dar acoperă toată adâncimea
volumul de intrare.

Sarcina principală efectuată la stratul convoluțional este extragerea de nivel înalt
Caracteristici. Primul (așa cum se arată în imaginea de mai sus) este responsabil pentru extragerea low-
caracteristici de nivel cum ar fi culoarea, marginile etc. Straturile convoluționale ulterioare scot
caracteristici de nivel înalt, conducând astfel la o înțelegere/examinare completă a imaginii.

Stratul de pooling

Acest strat este menit să reducă dimensiunea spațială a reprezentării imaginii. Ca atare, ea
ajută, de asemenea, la reducerea volumului de calcul și procesare în rețeaua neuronală.
În plus, extrage și caracteristici dominante care sunt pozițional și rotațional
invariant.

Un tip de pooling se realizează prin utilizarea operației Max. Această operațiune alege
valoarea maximă din fiecare grup de neuroni la stratul anterior. Celălalt tip de pooling
este gruparea medie care returnează o valoare medie din cluster.
Deoarece Max pooling acționează și ca un supresor de zgomot, are performanțe mai bune decât Average
punerea în comun.

După cum este descris în imaginea de mai sus, există mai multe straturi de grupare în plus față de
straturi convoluționale. Cu cât numărul acestor straturi este mai mare, cu atât mai multe caracteristici de nivel scăzut
vor fi extrase. Cu toate acestea, puterea de calcul cheltuită va crește, de asemenea.

Acum că imaginea a trecut prin toate actualele convoluții și punerea în comun
straturi, extragerea caracteristicilor este completă. Acum este timpul pentru clasificarea imaginii. Stratul complet conectat îndeplinește această sarcină.

Straturile complet conectate (FCL)

Ca ultimul strat, stratul FC este pur și simplu o rețea neuronală feed-forward. Intrarea către
stratul complet conectat este rezultatul aplatizat al ultimului pooling/convolutional
strat. A aplatiza înseamnă că matricea sau matricea tridimensională este derulată într-un vector.

Pentru fiecare strat FC are loc un calcul matematic specific. După ce vectorul a trecut prin toate straturile complet conectate, funcția de activare softmax este utilizată în stratul final. Acesta este folosit pentru a calcula probabilitatea ca intrarea să aparțină unei anumite sarcini.

Astfel, rezultatul final este probabilitățile diferite ca imaginea de intrare să aparțină unor clase diferite.

Procesul se repetă pentru diferite tipuri de imagini și imagini individuale din acele tipuri. Acest lucru antrenează rețeaua și o învață să facă diferența între un câine și o pisică și un trandafir și o floarea soarelui.

La pachet

Tehnologia de bază a rețelelor neuronale convoluționale este în continuă perfecționare. Rețelele sunt puternic antrenate astfel încât să producă probabilități precise. Se poate spune pe bună dreptate: în domeniul viziunii computerizate, CNN-urile înseamnă doar o revoluție.

Puteți verifica diploma noastră PG în învățare automată și IA , care oferă ateliere practice practice, mentor individual în industrie, 12 studii de caz și sarcini, statutul de absolvenți IIIT-B și multe altele.

Conduceți revoluția tehnologică condusă de inteligența artificială

PG DIPLOMĂ ÎN ÎNVĂŢAREA MACHINĂ ŞI INTELIGENTĂ ARTIFICIALĂ

Aflați mai multe