Algebra lineare per l'apprendimento automatico: concetti critici, perché imparare prima di ML
Pubblicato: 2020-04-30Apprendimento automatico, robotica, scienza dei dati, intelligenza artificiale e visione artificiale sono tra le aree che hanno contribuito a portare la nostra tecnologia al livello attuale. Quando inizi ad acquisire maggiori conoscenze su queste tecnologie, ti imbatterai in una serie di gerghi o parole specifiche comuni a queste tecnologie.
Alcuni di questi termini includono regressione lazo, condizioni KKT, PCA del kernel, macchine vettoriali di supporto (SVM), moltiplicatori di Lagrange e regressione della cresta, tra gli altri. Ora, questi gerghi possono essere coniati solo per tenere lontani gli estranei, ma dicono molto sulla loro associazione con la tipica algebra lineare che conosciamo dai nostri giorni a scuola.
Quindi, diventa imperativo per ogni individuo che sta imparando l'apprendimento automatico o la scienza dei dati per prima cosa fare i conti con cosa sono l'algebra lineare e la teoria dell'ottimizzazione. È inoltre necessario apprendere la scienza dei dati e sapere come usarli quando si risolvono problemi utilizzando il ML o quando si dà più senso agli enormi dati disponibili utilizzando la scienza dei dati.
In questo blog, ci concentreremo su come l'apprendimento automatico e l'algebra lineare sono correlati e su come una migliore comprensione di quest'ultima può aiutarti a padroneggiare la prima.
Ci sono concetti nell'apprendimento automatico, come SVM e regressione che non sarai in grado di comprendere correttamente se non sei a conoscenza della loro connessione di algebra lineare. Puoi andare senza approfondire l'algebra lineare e come è associata all'apprendimento automatico se stai solo esaminando questi concetti per sapere cosa sono effettivamente e non hai alcun desiderio di proseguire ulteriormente il loro studio.
Tuttavia, se hai intenzione di diventare un ingegnere dell'apprendimento automatico che in futuro sarà addestrato alle macchine o farà ricerche e darà un contributo significativo nel campo, dovrai scavare a fondo. Non ci sono alternative. Avere un solido background in algebra lineare è un must. Il nostro obiettivo principale nello scrivere questo blog è di presentarti i fondamenti dell'algebra lineare, assicurandoci di presentare come vengono utilizzati nell'apprendimento automatico. Cominciamo col capire cos'è esattamente l'algebra lineare.

Sommario
Che cos'è l'algebra lineare?
In parole semplici, è una branca della matematica che trova applicazioni significative nell'ingegneria e nelle scienze. Sebbene abbia una tale importanza e abbia applicazioni che vanno ben oltre la nostra immaginazione, vediamo che i nostri scienziati sono in ritardo quando si tratta di avere una comprensione più profonda di esso. Il motivo principale alla base di ciò è perché non è la matematica discreta che troviamo che la maggior parte degli scienziati utilizzi frequentemente.
Appartiene alla parte continua della matematica, il che la rende meno interessante per gli scienziati e per le persone che lavorano nel campo della tecnologia. Ora mettiamo in chiaro una cosa. Se non hai nemmeno una conoscenza di base di come funziona l'algebra lineare, troverai molto difficile imparare e utilizzare diversi algoritmi di apprendimento automatico, inclusi quelli di deep learning.
Quando hai finito con come funziona fondamentalmente l'apprendimento automatico e come e dove puoi usare i suoi algoritmi, ti verrà richiesto di dedicare un po' più di tempo all'apprendimento della matematica. Questo ti aiuterà a capire molte cose nuove sugli algoritmi di apprendimento automatico che in precedenza non avevi. Saprai molto sui loro limiti, ipotesi sottostanti e quant'altro.
Ora ti imbatterai in diverse aree della matematica che studi a questo punto per imparare a fare di più con l'apprendimento automatico. Puoi studiare geometria, algebra, calcolo e statistica tra gli altri argomenti; tuttavia, devi essere saggio qui e selezionare l'area che ritieni possa davvero aiutarti ad arricchire la tua esperienza e fornirti una base più solida mentre avanzi nella tua carriera di apprendimento automatico. Puoi anche chiedere agli esperti di aiutarti a prendere una decisione.
La prossima domanda che ti porrai ora sarà come devi affrontare questo processo di apprendimento. Non puoi studiare l'algebra lineare da zero. Dovrai selezionare e scegliere gli argomenti utilizzati nell'apprendimento automatico in un modo o nell'altro. Nella prossima sezione, discuteremo alcuni di quegli argomenti di algebra lineare che puoi scegliere di studiare.
Scopri di più: i 5 migliori modelli di machine learning spiegati per i principianti
Concetti importanti di algebra lineare
È molto importante avere una conoscenza sufficiente di alcuni concetti di algebra lineare se stai cercando di comprendere i concetti alla base dell'apprendimento automatico. Se non conosci la matematica dietro questi algoritmi avanzati di apprendimento automatico, non puoi desiderare di sviluppare una padronanza su di essi. Ecco alcuni concetti di algebra lineare che devi conoscere per sapere come funziona l'apprendimento automatico.
1. Vettori e matrice
Non sarà sbagliato dire che questi due concetti sono probabilmente i due più importanti che devi imparare considerando la loro stretta fedeltà all'apprendimento automatico. I vettori sono costituiti da una matrice di numeri mentre una matrice comprende vettori 2-D che di solito sono menzionati in maiuscolo.
Ora vediamo come sono collegati agli algoritmi di apprendimento automatico. I vettori si trovano utili negli algoritmi di apprendimento automatico supervisionati dove sono presenti sotto forma di variabili target. D'altra parte, le caratteristiche disponibili nei dati formano la matrice. È possibile eseguire una serie di operazioni utilizzando la matrice: coniugazione, moltiplicazione, rango, trasformazione e altre. Per eseguire sottrazioni e addizioni possono essere utilizzati anche due vettori con lo stesso numero di elementi e uguaglianza di forma.
2. Matrice simmetrica
La matrice simmetrica ha importanza sia nell'algebra lineare che nell'apprendimento automatico. Le matrici di algebra lineare sono utilizzate principalmente per trasportare funzioni. Il più delle volte, queste funzioni sono simmetriche, così come le matrici che corrispondono ad esse. Queste funzioni ei valori che contengono possono essere utilizzati per misurare la distanza delle caratteristiche. Possono anche essere usati per misurare la covarianza delle caratteristiche. Di seguito sono elencate alcune proprietà delle matrici simmetriche:
- Le matrici simmetriche e la loro inversa sono entrambe simmetriche.
- Tutti i valori negli autovalori sono numeri reali. Non sono presenti numeri complessi.
- Una matrice simmetrica si forma quando una matrice viene moltiplicata per la sua trasposizione.
- Le matrici simmetriche possiedono anche la proprietà della fattorizzazione.
- Per le matrici che hanno colonne linearmente indipendenti, il risultato quando la matrice viene moltiplicata per la sua trasposizione è invertibile.
3. Autovalori e Autovettori
Gli autovettori sono vettori che cambiano solo di un fattore scalare e non vi è alcun cambiamento nella loro direzione. L'autovalore corrispondente agli autovettori è la grandezza di cui sono ridimensionati. Gli autovalori e gli autovettori si trovano nei fondamenti della matematica e dell'informatica. Quando tracciamo un vettore su un grafico XY, segue una direzione specifica. Quando applichiamo la trasformazione lineare su alcuni vettori, vediamo che non cambiano la loro direzione. Questi vettori sono molto importanti nell'apprendimento automatico.
Gli autovalori e gli autovettori vengono utilizzati per ridurre al minimo il rumore dei dati. Possiamo anche usare i due per migliorare l'efficienza dei compiti che sono noti per essere ad alta intensità di calcolo. Possono anche essere usati per eliminare l'overfitting. Esistono anche molti altri scenari in cui gli autovalori e gli autovettori si rivelano utili.

È abbastanza difficile visualizzare le caratteristiche dei dati sonori, testuali o di immagine. Questi dati sono generalmente rappresentati in 3D. È qui che entrano in gioco autovalori e autovettori. Possono essere usati per catturare tutta l'enorme quantità di ciò che è memorizzato in una matrice. Anche gli autovalori e gli autovettori sono usati nel riconoscimento facciale.
Leggi: Idee per progetti di apprendimento automatico per principianti
4. Analisi dei componenti principali (PCA)
Ci sono molte volte in cui la dimensionalità rende le cose difficili quando si tratta di risolvere determinati problemi di apprendimento automatico. In questi problemi si tratta di dati le cui caratteristiche hanno un'altissima correlazione tra loro e si trovano in una dimensione più alta del solito.
Il problema che emerge con questo problema di dimensionalità è che diventa molto difficile capire l'influenza che ogni caratteristica ha sulla variabile target. Questo perché le caratteristiche con una correlazione più alta del normale tendono a influenzare l'obiettivo allo stesso modo. È anche molto difficile visualizzare i dati che si trovano in una dimensione superiore.
L'analisi delle componenti principali è la soluzione a questi problemi. Ti aiuta a ridurre la dimensione dei dati in 2D o 3D. Questo viene fatto assicurando che nessuna informazione venga persa a causa di modifiche nella varianza massima. La matematica dietro PCA si riferisce all'ortogonalità. PCA è il miglior metodo disponibile per rendere il modello meno complesso riducendo il numero di funzionalità nel set di dati.
Tuttavia, dovresti evitare di usarlo come passaggio iniziale per eliminare l'overfitting. Dovresti iniziare limitando il numero di funzioni nei dati o aumentando la quantità di dati. Dovresti quindi provare a utilizzare la regolarizzazione L1 o L2. Se nulla funziona, solo allora dovresti passare a PCA.
Leggi anche: Le 9 migliori librerie di machine learning che dovresti conoscere
Perché dovresti imparare l'algebra lineare prima dell'apprendimento automatico?
1. L'algebra lineare è la chiave per eccellere nell'apprendimento automatico
Non si può negare il fatto che il calcolo supera l'algebra lineare quando si tratta di matematica avanzata. Il calcolo integrale e differenziale ti aiuta molto più che con l'integrazione, la differenziazione e i limiti, servono anche come conoscenza fondamentale richiesta per applicazioni, come tensori e vettori.
Imparare queste cose ti aiuterà ad avere una migliore comprensione delle equazioni lineari e delle funzioni lineari tra le altre aree. Conoscerai anche concetti avanzati, come il metodo Simplex e i vettori spaziali. Se hai bisogno di aiuto con la programmazione lineare, puoi usare il metodo Simplex. Per approfondire questi concetti, inizia dando più tempo all'algebra lineare.
2. Previsione dell'apprendimento automatico
Quando impari l'algebra lineare, migliori la consapevolezza o l'istinto che gioca un ruolo così importante nell'apprendimento automatico. Ora sarai in grado di fornire più prospettive. Le matrici e i vettori che hai studiato ti aiuteranno ad ampliare il tuo pensiero e renderlo più incrollabile. Le possibilità sono infinite. Potresti iniziare a fare cose che gli altri intorno a te troveranno molto difficile da capire. Potresti iniziare a visualizzare e impostare diversi grafici. Potresti iniziare a utilizzare più parametri per diversi componenti di machine learning.
3. L'algebra lineare aiuta a creare algoritmi di apprendimento automatico migliori
Puoi utilizzare il tuo apprendimento dell'algebra lineare per costruire algoritmi di apprendimento automatico meglio supervisionati e non supervisionati. La regressione logistica, la regressione lineare, gli alberi decisionali e le macchine vettoriali di supporto (SVM) sono alcuni algoritmi di apprendimento supervisionato che puoi creare da zero con l'aiuto dell'algebra lineare.
D'altra parte, puoi anche usarlo per algoritmi non supervisionati, inclusa la scomposizione a valore singolo (SVD), il clustering e l'analisi dei componenti. L'algebra lineare ti aiuterà a sviluppare una comprensione più approfondita del progetto di apprendimento automatico su cui stai lavorando e quindi ti darà la flessibilità di personalizzare diversi parametri. Puoi saperne di più sulla regressione lineare nell'apprendimento automatico.
4. Algebra lineare per una migliore elaborazione grafica nell'apprendimento automatico
I progetti di apprendimento automatico ti offrono diverse interpretazioni grafiche su cui lavorare: immagini, audio, video e rilevamento dei bordi. Gli algoritmi di apprendimento automatico hanno classificatori che addestrano una parte del set di dati fornito in base alle loro categorie. Un altro compito dei classificatori è eliminare gli errori dai dati che sono già stati addestrati.

È in questa fase che l'algebra lineare entra in gioco per aiutare a calcolare questo insieme di dati complesso e di grandi dimensioni. Utilizza tecniche di scomposizione della matrice per elaborare e gestire dati di grandi dimensioni per diversi progetti. I metodi di scomposizione della matrice più popolari sono la scomposizione QR e LU.
5. Algebra lineare per migliorare la tua interpretazione delle statistiche
Le statistiche sono molto importanti per organizzare e integrare i dati nell'apprendimento automatico. Se vuoi capire meglio i concetti statistici, devi prima sapere come funziona l'algebra lineare. L'algebra lineare ha metodi, operazioni e notazioni che possono aiutare a integrare argomenti statistici avanzati come l'analisi multivariata nel tuo progetto.
Si supponga di lavorare sui dati del paziente che includono peso, altezza, pressione sanguigna e frequenza cardiaca. Queste sono le molteplici variabili del set di dati su cui stai lavorando. Assumiamo qui che un aumento di peso porterà ad un aumento della pressione sanguigna. Non è troppo difficile capire che si tratta di una relazione lineare. Quindi, per capire meglio come un aumento di una variabile influenzi l'altra, dovrai avere una buona comprensione dell'algebra lineare.
Conclusione
L'apprendimento automatico di per sé è un argomento piuttosto vasto; tuttavia, ci sono altri concetti, come l'algebra lineare, che sono importanti da imparare quanto lo stesso ML. L'apprendimento dell'algebra lineare e altri argomenti simili aiuterà a comprendere meglio i concetti dell'apprendimento automatico.
Se sei interessato a saperne di più sull'apprendimento automatico, dai un'occhiata al Diploma PG di IIIT-B e upGrad in Machine Learning e AI, progettato per i professionisti che lavorano e offre oltre 450 ore di formazione rigorosa, oltre 30 casi di studio e incarichi, IIIT- B Status di Alumni, oltre 5 progetti pratici pratici e assistenza sul lavoro con le migliori aziende.
Qual è più importante per l'apprendimento automatico: calcolo o algebra lineare?
Se hai intenzione di costruire una carriera nell'apprendimento automatico, devi già sapere che le basi di questo campo sono profonde nella matematica. La matematica dell'apprendimento automatico è composta da 3 aree chiave, calcolo, algebra lineare e statistica. Poiché l'apprendimento automatico coinvolge molti vettori e matrici, l'algebra lineare ne costituisce le parti più fondamentali. Ma poi anche il calcolo è parte integrante del ML poiché aiuta a capire come funziona il meccanismo di apprendimento automatico. Quindi sia il calcolo che l'algebra lineare sono ugualmente importanti. Tuttavia, la quantità di entrambi che devi utilizzare dipende principalmente dai ruoli e dalle responsabilità del tuo lavoro.
L'algebra lineare è più difficile da imparare del calcolo?
L'algebra lineare riguarda lo studio di linee rette usando equazioni lineari, mentre il calcolo riguarda componenti che variano uniformemente che coinvolgono derivate, vettori, integrali, curve e altro. Detto questo, l'algebra lineare è molto più semplice da imparare rispetto anche al calcolo di base. In algebra lineare, se riesci a comprendere la teoria alla base dei teoremi di algebra lineare, puoi risolvere tutte le domande correlate. Tuttavia, ciò non è sufficiente per risolvere i problemi di calcolo. Più della semplice memorizzazione di algoritmi, cioè la parte teorica, è necessario comprendere gli aspetti computazionali per rispondere a domande computazionali nel calcolo. Il calcolo è la parte più impegnativa della matematica, mentre l'algebra lineare è più concreta e meno astratta; d'ora in poi più facile da capire.
Le statistiche sono importanti nell'apprendimento automatico?
Quando si tratta di machine learning, non puoi tralasciare le statistiche. Gli esperti sono dell'opinione che l'apprendimento automatico sia una statistica applicata, quindi è un prerequisito per coloro che desiderano intraprendere una carriera nell'apprendimento automatico. Nella progettazione di modelli di apprendimento automatico, i dati svolgono un ruolo fondamentale. Sono necessarie tecniche statistiche per trovare risposte basate sui dati accumulati che verranno utilizzati per addestrare diversi modelli di machine learning. Quindi una familiarità di base con le statistiche è obbligatoria per l'apprendimento automatico.