Tipi di algoritmi di intelligenza artificiale che dovresti conoscere [Una guida completa]

Pubblicato: 2019-11-13

L'intelligenza artificiale è cresciuta fino ad avere un impatto significativo sul mondo. Con grandi quantità di dati generati da diverse applicazioni e fonti, i sistemi di apprendimento automatico possono apprendere dai dati di test ed eseguire attività intelligenti.

L'intelligenza artificiale è il campo dell'informatica che si occupa di impartire l'abilità decisiva e pensare l'abilità alle macchine. L'intelligenza artificiale è quindi una miscela di informatica, analisi dei dati e matematica pura.

L'apprendimento automatico diventa parte integrante dell'Intelligenza Artificiale e si occupa solo della prima parte, il processo di apprendimento dai dati di input. L'intelligenza artificiale e i suoi benefici non hanno mai smesso di stupirci.

Partecipa ai corsi di intelligenza artificiale online dalle migliori università del mondo: master, programmi post-laurea esecutivi e programma di certificazione avanzata in ML e AI per accelerare la tua carriera.

Sommario

Tipi di algoritmi di intelligenza artificiale

Gli algoritmi di intelligenza artificiale possono essere classificati come:

1. Algoritmi di classificazione

Gli algoritmi di classificazione fanno parte dell'apprendimento supervisionato. Questi algoritmi vengono utilizzati per dividere la variabile soggetta in classi diverse e quindi prevedere la classe per un dato input. Ad esempio, gli algoritmi di classificazione possono essere utilizzati per classificare le email come spam o meno. Discutiamo alcuni degli algoritmi di classificazione comunemente usati.

a) Ingenuo Bayes

L'algoritmo di Naive Bayes funziona sul teorema di Bayes e adotta un approccio probabilistico, a differenza di altri algoritmi di classificazione. L'algoritmo ha una serie di probabilità a priori per ciascuna classe. Una volta inseriti i dati, l'algoritmo aggiorna queste probabilità per formare qualcosa noto come probabilità a posteriori. Ciò risulta utile quando è necessario prevedere se l'input appartiene o meno a un determinato elenco di classi.

b) Albero decisionale

L'algoritmo dell'albero decisionale è più un diagramma di flusso come un algoritmo in cui i nodi rappresentano il test su un attributo di input e i rami rappresentano il risultato del test.

c) Foresta casuale

La foresta casuale funziona come un gruppo di alberi. Il set di dati di input è suddiviso e inserito in diversi alberi decisionali. Viene considerata la media degli output di tutti gli alberi decisionali. Le foreste casuali offrono un classificatore più accurato rispetto all'algoritmo dell'albero decisionale.

d) Supportare le macchine vettoriali

SVM è un algoritmo che classifica i dati utilizzando un iperpiano, assicurandosi che la distanza tra l'iperpiano e i vettori di supporto sia massima.

e) K Vicini più vicini

L'algoritmo KNN utilizza una serie di punti dati separati in classi per prevedere la classe di un nuovo punto dati campione. Si chiama "algoritmo di apprendimento pigro" in quanto è relativamente breve rispetto ad altri algoritmi.

2. Algoritmi di regressione

Gli algoritmi di regressione sono un algoritmo popolare negli algoritmi di apprendimento automatico supervisionati. Gli algoritmi di regressione possono prevedere i valori di output in base ai punti dati di input inseriti nel sistema di apprendimento. L'applicazione principale degli algoritmi di regressione include la previsione del prezzo del mercato azionario, la previsione del tempo, ecc. Gli algoritmi più comuni in questa sezione sono

a) Regressione lineare

Viene utilizzato per misurare le qualità autentiche considerando le variabili coerenti. È il più semplice di tutti gli algoritmi di regressione ma può essere implementato solo nei casi di relazione lineare o di un problema linearmente separabile. L'algoritmo disegna una linea retta tra i punti dati denominata linea di adattamento o linea di regressione e viene utilizzato per prevedere nuovi valori.

Leggi: Regressione lineare - Domande e risposte sull'intervista ML

b) Regressione con lazo

L'algoritmo di regressione lazo funziona ottenendo il sottoinsieme di predittori che riduce al minimo l'errore di previsione per una variabile di risposta. Ciò si ottiene imponendo un vincolo sui punti dati e consentendo ad alcuni di essi di ridursi a un valore zero.

c) Regressione logistica

La regressione logistica viene utilizzata principalmente per la classificazione binaria. Questo metodo consente di analizzare un insieme di variabili e prevedere un risultato categoriale. Le sue applicazioni principali includono la previsione del valore della vita del cliente, i valori delle case, ecc

d) Regressione multivariata

Questo algoritmo deve essere utilizzato quando è presente più di una variabile predittiva. Questo algoritmo è ampiamente utilizzato nei motori di raccomandazione dei prodotti nel settore della vendita al dettaglio, in cui i prodotti preferiti dai clienti dipenderanno da molteplici fattori come marchio, qualità, prezzo, recensione ecc.

e) Algoritmo di regressione multipla

L'algoritmo di regressione multipla utilizza una combinazione di algoritmi di regressione lineare e non lineare che prendono più variabili esplicative come input. Le principali applicazioni includono la ricerca nelle scienze sociali, la genuinità dei sinistri assicurativi, l'analisi comportamentale, ecc.

3. Algoritmi di clustering

Il clustering è il processo di segregazione e organizzazione dei punti dati in gruppi in base alle somiglianze all'interno dei membri del gruppo. Questo fa parte dell'apprendimento senza supervisione. L'obiettivo principale è raggruppare elementi simili. Ad esempio, può organizzare insieme tutte le transazioni di natura fraudolenta in base ad alcune proprietà della transazione. Di seguito sono riportati gli algoritmi di clustering più comuni.

a) Clustering dei mezzi K

È il più semplice algoritmo di apprendimento senza supervisione. L'algoritmo raccoglie insieme punti dati simili e quindi li lega insieme in un cluster. Il raggruppamento viene effettuato calcolando il baricentro del gruppo di punti dati e quindi valutando la distanza di ciascun punto dati dal centroide del cluster. In base alla distanza, il punto dati analizzato viene quindi assegnato al cluster più vicino. "K" in K-mean indica il numero di cluster in cui vengono raggruppati i punti dati.

b) Algoritmo dei mezzi C fuzzy

L'algoritmo FCM funziona sulla probabilità. Si considera che ogni punto dati abbia una probabilità di appartenere a un altro cluster. I punti dati non hanno un'appartenenza assoluta a un cluster particolare, ed è per questo che l'algoritmo è chiamato fuzzy.

c) Algoritmo Aspettativa-Massimizzazione (EM).

Si basa sulla distribuzione gaussiana che abbiamo appreso nelle statistiche. I dati sono rappresentati in un modello di distribuzione gaussiano per risolvere il problema. Dopo aver assegnato una probabilità, viene calcolato un campione puntuale in base alle equazioni di aspettativa e massimizzazione.

d) Algoritmo di clustering gerarchico

Questi algoritmi ordinano i cluster in ordine gerarchico dopo aver appreso i punti dati e aver effettuato osservazioni di somiglianza. Può essere di due tipi

  • Clustering divisivo, per un approccio top-down
  • Clustering agglomerato, per un approccio bottom-up

Chiudiamo e concludiamo

L'intelligenza artificiale ha spaventato il mondo più volte e ha molte applicazioni nel mondo reale per risolvere i suoi problemi complessi. Ci auguriamo che questo articolo abbia fatto luce sui vari algoritmi di Intelligenza Artificiale e sulle loro classificazioni generali. Gli algoritmi vengono scelti in base alla necessità e alla natura dei punti dati di cui disponiamo.

Gli algoritmi hanno i loro vantaggi e svantaggi in termini di precisione, prestazioni e tempo di elaborazione. Questi sono solo alcuni algoritmi. Se sei interessato a saperne di più, dai un'occhiata al programma Executive PG di upGrad e IIIT-B in Machine Learning e AI .

Cos'è l'ingenuo bayes?

Il teorema di Bayes è utilizzato nell'algoritmo di Naive Bayes, che, a differenza degli altri algoritmi di questo elenco, adotta un approccio probabilistico. Ciò significa semplicemente che il metodo ha una serie di probabilità a priori stabilite per ciascuna delle classificazioni per il tuo obiettivo, piuttosto che saltare direttamente ai dati. L'algoritmo modifica queste probabilità a priori per generare la probabilità a posteriori quando si alimentano i dati. Di conseguenza, questo può essere incredibilmente vantaggioso in situazioni in cui è necessario anticipare se il proprio input corrisponde a una delle n classi o a nessuna di esse. Questo è fattibile usando una tecnica probabilistica perché le probabilità lanciate per tutte le n classi saranno piuttosto basse.

Che cos'è un albero decisionale?

L'albero decisionale è semplicemente una struttura ad albero simile a un diagramma di flusso in cui ogni nodo esterno rappresenta una prova su un attributo e ogni ramo indica il risultato del test. Le etichette previste vengono archiviate nei nodi foglia. Iniziamo dalla radice dell'albero e ci dirigiamo verso il nodo foglia confrontando i valori degli attributi. Quando si tratta di dati ad alta dimensione e con poco tempo dedicato alla preparazione dei dati, utilizziamo questo classificatore. Un avvertimento, tuttavia: sono soggetti a overfitting e possono variare notevolmente anche con piccoli cambiamenti nei dati di allenamento.

Che cos'è una macchina vettore di supporto?

Nella misura in cui tenta di ordinare i punti dati con i margini tra due classi il più ampi possibile, una SVM è unica. Questo è indicato come la separazione del margine massimo. Un altro punto da tenere a mente è che, a differenza della regressione lineare, le SVM tracciano l'iperpiano utilizzando solo i vettori di supporto, mentre la regressione lineare utilizza l'intero set di dati. Le SVM sono particolarmente utili in circostanze in cui i dati hanno molte dimensioni. Quindi inizi generando un iperpiano casuale, quindi misurando la distanza tra esso e i valori dei dati più vicini di ciascuna classe. I vettori di supporto sono i punti dati più vicini all'iperpiano.