Esercitazione sulla rete neurale: guida passo passo per principianti

Pubblicato: 2019-11-20

Nel campo del machine learning, ci sono molti concetti interessanti. Qui, in questo tutorial sulle reti neurali, discuteremo uno dei concetti fondamentali delle reti neurali. Questo articolo ti aiuterà a comprendere il funzionamento di queste reti spiegando la teoria alla base delle stesse.

Dopo aver terminato questo tutorial sulla rete neurale artificiale, scoprirai:

  • Cos'è una rete neurale?
  • Come funziona una rete neurale?
  • Quali sono i tipi di reti neurali?

Sommario

Cosa sono le reti neurali?

Una rete neurale è un sistema progettato per agire come un cervello umano. È piuttosto semplice ma prevalente nella nostra vita quotidiana.

Una definizione complessa sarebbe che una rete neurale è un modello computazionale che ha un'architettura di rete. Questa architettura è composta da neuroni artificiali. Questa struttura ha parametri specifici attraverso i quali è possibile modificarla per eseguire determinati compiti.

Hanno ampie proprietà di approssimazione. Ciò significa che possono approssimare una funzione a qualsiasi livello di precisione, indipendentemente dalla sua dimensione. Le reti neurali trovano applicazioni estese in aree in cui i computer tradizionali non funzionano molto bene. Da Siri a Google Maps, le reti neurali sono presenti in ogni luogo in cui viene utilizzata l'Intelligenza Artificiale.

Sono una parte vitale delle operazioni di intelligenza artificiale. Le reti neurali prendono ispirazione dal cervello umano e quindi anche la loro struttura è simile a una.

Come funziona una rete neurale?

Una rete neurale ha molti livelli. Ogni livello svolge una funzione specifica e più complessa è la rete, più livelli sono. Ecco perché una rete neurale è anche chiamata perceptron multistrato.

La forma più pura di una rete neurale ha tre strati:

  1. Il livello di input
  2. Lo strato nascosto
  3. Il livello di output

Come suggeriscono i nomi, ognuno di questi livelli ha uno scopo specifico. Questi livelli sono costituiti da nodi. Ci possono essere più livelli nascosti in una rete neurale in base ai requisiti. Il livello di input raccoglie i segnali di input e li trasferisce al livello successivo. Raccoglie i dati dal mondo esterno.

Il livello nascosto esegue tutte le attività di calcolo di back-end. Una rete può anche avere zero livelli nascosti. Tuttavia, una rete neurale ha almeno un livello nascosto. Il livello di output trasmette il risultato finale del calcolo del livello nascosto.

Come altre applicazioni di apprendimento automatico, dovrai addestrare anche una rete neurale con alcuni dati di addestramento, prima di fornirle un problema particolare. Ma prima di approfondire il modo in cui una rete neurale risolve un problema, dovresti prima conoscere il funzionamento dei livelli percettronici:

Come funzionano i livelli di Perceptron?

Una rete neurale è composta da molti strati percettori; ecco perché ha il nome "perceptron multistrato". Questi strati sono anche chiamati strati nascosti di strati densi. Sono costituiti da molti neutroni percettronici. Sono l'unità primaria che lavora insieme per formare uno strato perceptron. Questi neuroni ricevono informazioni nell'insieme di input. Combina questi input numerici con una distorsione e un gruppo di pesi, che quindi produce un unico output.

Per il calcolo, ogni neurone considera pesi e bias. Quindi, la funzione di combinazione utilizza il peso e il bias per fornire un output (input modificato). Funziona attraverso la seguente equazione:

combinazione = bias + pesi * input

Successivamente, la funzione di attivazione produce l'uscita con la seguente equazione:

uscita = attivazione (combinazione)

Questa funzione determina il tipo di ruolo svolto dalla rete neurale. Formano gli strati della rete. Le funzioni di attivazione prevalenti sono le seguenti:

La funzione lineare

In questa funzione l'output è solo la combinazione del neurone:

attivazione = combinazione

La funzione iperbolica tangente

È la funzione di attivazione più popolare tra le reti neurali. È una funzione sigmoidea e si trova tra -1 e +1:

attivazione = tanh(combinazione)

La funzione logistica

La funzione logistica è abbastanza simile alla funzione tangente iperbolica perché è anche una specie di funzione sigmoidea. Tuttavia, è diverso perché è compreso tra 0 e 1:

attivazione = 1 1 + e -combinazione

La funzione di unità lineare rettificata

Proprio come la funzione iperbolica tangente, anche la funzione dell'unità lineare rettificata è prevalente. Un altro nome per la funzione dell'unità lineare rettificata è ReLU. ReLU è uguale alla combinazione quando è uguale o maggiore di zero ed è negativo se la combinazione è inferiore (negativa) a zero.

Quindi, come funziona esattamente una rete neurale?

Ora che sai cosa c'è dietro una rete neurale e come funziona, possiamo concentrarci sul funzionamento di una rete neurale.

Ecco come funziona:

  1. Le informazioni vengono immesse nel livello di input che le trasferisce al livello nascosto
  2. Le interconnessioni tra i due strati assegnano pesi a ciascun ingresso in modo casuale
  3. Una distorsione aggiunta a ogni input dopo che i pesi sono stati moltiplicati individualmente con loro
  4. La somma pesata viene trasferita alla funzione di attivazione
  5. La funzione di attivazione determina quali nodi deve essere attivato per l'estrazione delle funzionalità
  6. Il modello applica una funzione dell'applicazione al livello di output per fornire l'output
  7. I pesi vengono regolati e l'output viene propagato all'indietro per ridurre al minimo l'errore

Il modello utilizza una funzione di costo per ridurre il tasso di errore. Dovrai cambiare i pesi con diversi modelli di allenamento.

  1. Il modello confronta l'output con il risultato originale
  2. Ripete il processo per migliorare la precisione

Il modello regola i pesi in ogni iterazione per migliorare la precisione dell'output.

Partecipa al corso di intelligenza artificiale online dalle migliori università del mondo: master, programmi post-laurea esecutivi e programma di certificazione avanzato in ML e AI per accelerare la tua carriera.

Tipi di reti neurali

1) Rete neurale ricorrente (RNN)

In questa rete, l'output di un livello viene salvato e ritrasferito all'input. In questo modo, i nodi di un particolare livello ricordano alcune informazioni sui passaggi passati. La combinazione del livello di input è il prodotto della somma di pesi e caratteristiche. Il processo ricorrente della rete neurale inizia negli strati nascosti.

Qui, ogni nodo ricorda alcune delle informazioni del suo passaggio antecedente. Il modello conserva alcune informazioni da ogni iterazione, che può utilizzare in seguito. Il sistema impara da sé quando il suo risultato è sbagliato. Quindi utilizza tali informazioni per aumentare l'accuratezza della sua previsione nella retropropagazione. L'applicazione più popolare di RNN è nella tecnologia di sintesi vocale.

2) Rete neurale convoluzionale (CNN)

Questa rete è costituita da uno o più strati convoluzionali. Il livello convoluzionale presente in questa rete applica una funzione convoluzionale sull'input prima di trasferirlo al livello successivo. Per questo motivo, la rete ha meno parametri, ma diventa più profonda. Le CNN sono ampiamente utilizzate nell'elaborazione del linguaggio naturale e nel riconoscimento delle immagini.

3) Rete neurale con funzione di base radiale (RBFNN)

Questa rete neurale utilizza una funzione di base radiale. Questa funzione considera la distanza di un punto dal centro. Queste reti sono costituite da due livelli. Il livello nascosto combina le caratteristiche con la funzione di base radiale e trasferisce l'output al livello successivo.

Il livello successivo esegue lo stesso mentre si utilizza l'output del livello precedente. Le reti neurali con funzione di base radiale sono utilizzate nei sistemi di alimentazione.

4) Rete neurale feedforward (FNN)

Questa è la forma più pura di una rete neurale artificiale. In questa rete, i dati si spostano in una direzione, cioè dal livello di input al livello di output. In questa rete, lo strato di output riceve la somma dei prodotti degli input e dei loro pesi. Non c'è retropropagazione in questa rete neurale. Queste reti potrebbero avere molti o zero livelli nascosti. Questi sono più facili da mantenere e trovare applicazione nel riconoscimento facciale.

5) Rete neurale modulare

Questa rete possiede diverse reti che funzionano in modo indipendente. Tutti svolgono compiti specifici, ma non interagiscono tra loro durante il processo di calcolo.

In questo modo, una rete neurale modulare può svolgere un'attività estremamente complessa con un'efficienza molto più elevata. Queste reti sono più difficili da mantenere rispetto alle reti più semplici (come FNN), ma forniscono anche risultati più rapidi per attività complesse.

Ulteriori informazioni sulle reti neurali

Questo è tutto nel nostro tutorial sulla rete neurale. Devi aver visto quali attività possono svolgere queste reti. Sono utilizzati in quasi tutte le tecnologie che utilizziamo quotidianamente. Se vuoi saperne di più sulle reti neurali, puoi consultare il nostro catalogo di corsi su intelligenza artificiale e machine learning.

Puoi controllare il nostro programma Executive PG in Machine Learning e AI , che offre workshop pratici pratici, tutor del settore individuale, 12 casi di studio e incarichi, stato di Alumni IIIT-B e altro ancora.

Come funziona una rete neurale?

Il livello di input riceve i dati e li trasmette al livello nascosto. I pesi vengono assegnati a ciascun input in modo casuale dai collegamenti tra i due livelli. Dopo che i pesi sono stati moltiplicati individualmente con loro, viene applicata una distorsione a ciascun input. Alla funzione di attivazione viene passato il totale ponderato. Per l'estrazione delle funzionalità, la funzione di attivazione decide quali nodi devono essere attivati. Per fornire l'output, il modello utilizza una funzione dell'applicazione sul livello di output. Per ridurre l'errore, i pesi vengono modificati e l'output viene propagato all'indietro.

Che cos'è una rete neurale ricorrente?

L'output di un livello viene archiviato e rimandato all'input in questa rete. Di conseguenza, i nodi di un livello specifico conservano alcune informazioni sulle azioni precedenti. Il totale di pesi e caratteristiche determina la combinazione del livello di input. I livelli nascosti sono dove inizia il processo basato su rnn. Ogni nodo qui ricorda parte delle informazioni della fase precedente. Il modello salva alcuni dati da ogni iterazione in modo che possano essere utilizzati in seguito. Quando il risultato del sistema non è corretto, apprende da sé. Quindi utilizza tale conoscenza per ottimizzare l'accuratezza della sua previsione di back-propagation. La tecnologia di sintesi vocale è l'applicazione più comune di RNN.

Come funziona il perceptron multistrato?

Il nome "perceptron multistrato" deriva dal fatto che una rete neurale è composta da più strati di perceptron. Questi strati sono anche conosciuti come strati densi con strati nascosti. Sono composti da un gran numero di neutroni percettroni. Sono gli elementi costitutivi di base che compongono uno strato di perceptron. Le informazioni nella raccolta di input raggiungono questi neuroni. Questi input numerici sono combinati con un bias e un gruppo di pesi per produrre un singolo output.