Analisi discriminante lineare per l'apprendimento automatico: cosa devi sapere?

Pubblicato: 2020-05-22

Il progresso tecnologico negli ultimi anni ha consentito ai dispositivi connessi di gestire enormi quantità di dati. Tuttavia, l'archiviazione e la sicurezza dei dati rimangono ancora grandi preoccupazioni quando si tratta di quantità così enormi di dati. Questo è il motivo per cui è molto importante gestire i dati nel modo giusto. Spesso può essere un compito che richiede tempo.

È qui che entrano in gioco le tecniche di riduzione della dimensionalità dei dati, come l'analisi discriminante lineare o LDA . Queste tecniche possono aiutarti a gestire i set di dati in un modo molto migliore, garantendo al contempo la sicurezza e la privacy dei dati. Il nostro focus in questo blog sarà sulla discussione della tecnica di riduzione della dimensionalità dei dati dell'analisi discriminante lineare. Iniziamo parlando di riduzione della dimensionalità.

Sommario

Che cos'è la riduzione della dimensionalità?

Sarai in grado di comprendere meglio la tecnica dell'analisi discriminante lineare se conosci lo sfondo del concetto su cui si basa. Quando hai a che fare con dati multidimensionali, hai dati che hanno una serie di caratteristiche correlate tra loro. Se tracciamo dati multidimensionali in due o tre dimensioni, utilizziamo la tecnica della riduzione della dimensionalità.

Un'alternativa che è anche abbastanza comunemente usata come sostituto della riduzione della dimensionalità è il tracciamento dei dati utilizzando istogrammi, grafici a dispersione e box plot, tra gli altri. Questi grafici possono essere utilizzati per trovare modelli in un determinato insieme di dati grezzi. Tuttavia, i grafici non presentano i dati in un modo che sia facile da decifrare per la gente comune. Inoltre, i dati con molte funzionalità avrebbero bisogno di diversi grafici per identificare i modelli in quel set di dati.

Le tecniche di riduzione della dimensionalità dei dati, come LDA, aiutano a superare questi problemi utilizzando due o tre dimensioni per tracciare i dati. Ciò ti consentirà di essere più esplicito nella presentazione dei dati, il che avrà senso anche per le persone che non hanno un background tecnico.

Leggi: 25 Domande e risposte sull'intervista sull'apprendimento automatico

Che cos'è l'analisi discriminante lineare?

È una delle tecniche di riduzione della dimensionalità più utilizzate. Viene utilizzato nell'apprendimento automatico e nelle applicazioni che hanno a che fare con la classificazione dei modelli. LDA ha uno scopo molto specifico, che è quello di proiettare caratteristiche che esistono in uno spazio ad alta dimensione sullo spazio ad una dimensione inferiore.

Questo viene fatto per eliminare i problemi di dimensionalità comuni e ridurre i costi e le risorse dimensionali. Ronald A Fisher ha il merito per lo sviluppo del concetto originale nel 1936: Fisher's Discriminant Analysis o Linear Discriminant . In origine, il discriminante lineare era una tecnica a due classi. La versione multi-classe è arrivata più tardi.

L'analisi discriminante lineare è un metodo di classificazione supervisionato utilizzato per creare modelli di machine learning. Questi modelli basati sulla riduzione della dimensionalità vengono utilizzati nell'applicazione, come l'analisi predittiva di marketing e il riconoscimento delle immagini, tra gli altri. Discuteremo le applicazioni un po 'più tardi.

Quindi cosa stiamo cercando esattamente con LDA? Ci sono due aree che questa tecnica di riduzione della dimensionalità aiuta a scoprire – I parametri che possono essere usati per spiegare la relazione tra un gruppo e un oggetto – Il modello del precettore di classificazione che può aiutare a separare i gruppi. Questo è il motivo per cui LDA è ampiamente utilizzato per modellare varietà in diversi gruppi. Quindi puoi usare questa tecnica per usare due o più di due classi per la distribuzione di una variabile.

Estensioni all'analisi discriminante lineare

LDA è considerato uno dei metodi più semplici ed efficaci disponibili per la classificazione. Poiché il metodo è così semplice e facile da capire, abbiamo alcune varianti e estensioni disponibili per esso. Alcuni di questi includono:

1. Analisi discriminante regolarizzata o RDA

RDA viene utilizzato per portare la regolarizzazione nella stima della varianza o della covarianza. Questo viene fatto per moderare l'impatto che le variabili hanno sull'LDA.

2. Analisi discriminante quadratica o QDA

In QDA, classi diverse utilizzano la propria stima della varianza. Nel caso in cui il numero della variabile di input sia maggiore del normale, ogni classe utilizza la sua stima di covarianza.

3. Analisi discriminante flessibile o FDA

La FDA fa uso di input con combinazioni non lineari. Le spline sono un buon esempio.

Informazioni su: Idee e argomenti per i progetti Python

Applicazioni LDA comuni

LDA trova il suo impiego in diverse applicazioni. Può essere utilizzato in qualsiasi problema che può essere trasformato in un problema di classificazione. Esempi comuni includono il riconoscimento della velocità, il riconoscimento facciale, la chimica, la classificazione dei dati di microarray, il recupero di immagini, la biometria e la bioinformatica, solo per citarne alcuni. Discutiamo alcuni di questi.

1. Riconoscimento facciale

Nella visione artificiale, il riconoscimento facciale è considerato una delle applicazioni più popolari. Il riconoscimento facciale viene eseguito rappresentando i volti utilizzando grandi quantità di valori di pixel. LDA viene utilizzato per ridurre il numero di funzioni per preparare i motivi per l'utilizzo del metodo di classificazione. Le nuove dimensioni sono combinazioni di valori di pixel utilizzati per creare un modello.

2. Identificazione del cliente

Se desideri identificare i clienti sulla base della probabilità che acquisteranno un prodotto, puoi utilizzare LDA per raccogliere le caratteristiche dei clienti. Puoi identificare e scegliere quelle caratteristiche che descrivono il gruppo di clienti che mostrano maggiori possibilità di acquistare un prodotto.

3. Medico

L'LDA può essere utilizzata per classificare le malattie in diverse categorie, come gravi, lievi o moderate. Ci sono diversi parametri del paziente che andranno a condurre questa attività di classificazione. Questa classificazione consente ai medici di definire il ritmo del trattamento.

Leggi anche: 15 interessanti idee per progetti di apprendimento automatico per principianti

Conclusione

LDA è una tecnica semplice e ben compresa comunemente utilizzata nei modelli di classificazione ML. PCA e regressione logistica sono altre tecniche di riduzione della dimensionalità a nostra disposizione. Ma quando si tratta di problemi di classificazione speciali, LDA è preferito rispetto agli altri due.

Se sei interessato a saperne di più sull'apprendimento automatico, dai un'occhiata al Diploma PG di IIIT-B e upGrad in Machine Learning e AI, progettato per i professionisti che lavorano e offre oltre 450 ore di formazione rigorosa, oltre 30 casi di studio e incarichi, IIIT- B Status di Alumni, oltre 5 progetti pratici pratici e assistenza sul lavoro con le migliori aziende.

Che cos'è l'analisi discriminante lineare?

L'analisi discriminante lineare (LDA) è un algoritmo di classificazione per apprendere le caratteristiche sottostanti utili per discriminare un gruppo di campioni da tutti gli altri gruppi. Come risultato dell'applicazione dell'algoritmo LDA, otteniamo un nuovo set di funzionalità che può essere utilizzato per la previsione dell'appartenenza al gruppo. Ad esempio, supponiamo che tu raccolga indirizzi IP e desideri scoprire a quale paese appartengono. Hai un set di formazione di indirizzi IP di esempio e puoi identificare il paese di origine con un'accuratezza molto elevata. Se hai un nuovo indirizzo IP e vuoi sapere da quale paese proviene, puoi darlo a una LDA che lo assegnerà alla classe con la probabilità più alta.

Quali sono le applicazioni dell'analisi discriminante lineare?

L'analisi discriminante lineare (LDA) è un insieme di tecniche nel quadro dell'apprendimento supervisionato. LDA è un metodo in cui la variabile dipendente è separabile linearmente nello spazio delle caratteristiche. LDA viene utilizzato in Marketing, Finanza e altre aree per eseguire una serie di attività di classificazione come la profilazione dei clienti e il rilevamento delle frodi. Ad esempio, considera che vogliamo trovare una combinazione lineare di variabili indipendenti che separi due gruppi di punti dati. LDA trova una combinazione lineare delle variabili indipendenti che produce la massima separazione tra i due gruppi di punti dati nello spazio delle caratteristiche.

Che cos'è la riduzione della dimensionalità?

La riduzione della dimensionalità si riferisce a una raccolta di tecniche per ridurre il numero di variabili in un set di dati. La tecnica di riduzione dimensionale più comune è l'analisi dei componenti principali (PCA). La PCA è la tecnica di riduzione della dimensionalità più popolare grazie alla sua semplicità, eleganza matematica e proprietà statistiche elevate. PCA viene utilizzato per ridurre la dimensionalità di un set di dati identificando l'asse che contiene la maggiore varianza insieme al minor numero di errori.