Algebră liniară pentru învățarea automată: concepte critice, de ce să învățați înainte de ML

Publicat: 2020-04-30

Învățarea automată, robotica, știința datelor, inteligența artificială și viziunea pe computer se numără printre domeniile care au jucat un rol esențial în aducerea tehnologiei noastre la nivelul la care este acum. Pe măsură ce începeți să dobândiți mai multe cunoștințe despre aceste tehnologii, veți întâlni un set de jargonuri sau cuvinte specifice care sunt comune acestor tehnologii.

Unii dintre acești termeni includ regresia lasso, condițiile KKT, PCA de nucleu, mașinile vectoriale suport (SVM), multiplicatorii Lagrange și regresia ridge, printre altele. Acum, aceste jargonuri pot fi inventate doar pentru a-i ține departe pe cei din afară, dar spun multe despre asocierea lor cu algebra liniară tipică despre care știm din zilele noastre la școală.

Deci, devine imperativ pentru fiecare persoană care învață învățarea automată sau știința datelor să se împace mai întâi cu ce sunt algebra liniară și teoria optimizării. De asemenea, trebuie să învățați știința datelor și să știți cum să le folosiți atunci când rezolvați probleme folosind ML sau când înțelegeți mai mult datele enorme disponibile folosind știința datelor.

În acest blog, ne vom concentra asupra modului în care învățarea automată și algebra liniară sunt legate și modul în care o mai bună înțelegere a celei din urmă vă poate ajuta să stăpâniți pe prima.

Există concepte în învățarea automată, cum ar fi SVM și regresie, pe care nu le veți putea înțelege corect dacă nu sunteți conștient de conexiunea lor algebră liniară. Puteți merge fără să aprofundați în algebra liniară și în modul în care aceasta este asociată cu învățarea automată, dacă doar parcurgeți aceste concepte pentru a ști care sunt acestea de fapt și nu aveți dorința de a le continua studiul.

Cu toate acestea, dacă intenționați să deveniți un inginer de învățare automată care urmează să antreneze mașini în viitor sau să facă cercetări și să aducă contribuții semnificative în domeniu, va trebui să sapă adânc. Nu există altă alternativă. Este obligatoriu să ai un fundal ferm în algebra liniară. Obiectivul nostru principal al scrierii acestui blog este de a vă prezenta elementele fundamentale ale algebrei liniare, asigurându-ne că prezentăm modul în care acestea sunt utilizate în învățarea automată. Să începem prin a înțelege ce este exact algebra liniară.

Cuprins

Ce este algebra liniară?

Cu cuvinte simple, este o ramură a matematicii care găsește aplicații semnificative în inginerie și știință. Deși are o asemenea importanță și are aplicații care depășesc cu mult imaginația noastră, îi vedem pe oamenii de știință rămânând în urmă atunci când vine vorba de o înțelegere mai profundă a acesteia. Motivul principal din spatele acestui lucru este că nu este matematica discretă pe care majoritatea oamenilor de știință o folosesc în mod frecvent.

Ea aparține părții continue a matematicii, ceea ce o face mai puțin interesantă pentru oamenii de știință și oamenii care lucrează în domeniul tehnologiei. Acum să clarificăm un lucru. Dacă nici măcar nu aveți o înțelegere de bază a modului în care funcționează algebra liniară, vă va fi foarte greu să învățați și să utilizați mai mulți algoritmi de învățare automată, inclusiv cei de învățare profundă.

Când ați terminat cu modul în care funcționează în mod fundamental învățarea automată și cum și unde îi puteți folosi algoritmii, vi se va cere să acordați puțin mai mult timp învățării matematicii. Acest lucru vă va ajuta să înțelegeți o mulțime de lucruri noi despre algoritmii de învățare automată pe care anterior nu le-ați făcut. Veți ști multe despre limitările lor, ipotezele care stau la baza și altele.

Acum veți întâlni diferite domenii ale matematicii pe care le studiați în acest moment pentru a învăța să faceți mai multe cu învățarea automată. Puteți studia geometria, algebra, calculul și statistica, printre alte subiecte; totuși, trebuie să fii înțelept aici și să selectezi zona despre care crezi că te va ajuta cu adevărat să-ți îmbogățești experiența și să-ți ofere o bază mai fermă pe măsură ce îți faci drum înainte în cariera de învățare automată. Puteți chiar să cereți experților să vă ajute să luați o decizie.

Următoarea întrebare pe care ți-o vei pune acum va fi cum trebuie să faci acest proces de învățare. Nu poți studia algebra liniară de la zero. Va trebui să alegeți subiecte care sunt utilizate în învățarea automată într-un fel sau altul. În secțiunea următoare, vom discuta câteva dintre acele subiecte de algebră liniară pe care le puteți alege să le studiați.

Aflați mai multe: Top 5 modele de învățare automată explicate pentru începători

Concepte importante de algebră liniară

Este foarte important să aveți suficiente cunoștințe despre câteva concepte de algebră liniară dacă doriți să înțelegeți conceptele care stau la baza învățării automate. Dacă nu cunoașteți matematica din spatele acestor algoritmi avansați de învățare automată, nu vă puteți dori să vă dezvoltați o stăpânire asupra lor. Iată câteva concepte de algebră liniară despre care trebuie să înveți pentru a ști cum funcționează învățarea automată.

1. Vectori și Matrice

Nu va fi greșit să spunem că aceste două concepte sunt, fără îndoială, cele două cele mai importante pe care trebuie să le înveți, având în vedere loialitatea lor strânsă cu învățarea automată. Vectorii constau dintr-o matrice de numere, în timp ce o matrice cuprinde vectori 2-D care sunt de obicei menționați cu majuscule.

Acum să vedem cum sunt conectați cu algoritmii de învățare automată. Vectorii se găsesc utili în algoritmii de învățare automată supravegheați, unde sunt prezenți sub formă de variabile țintă. Pe de altă parte, caracteristicile disponibile în datele formează matricea. Puteți efectua o serie de operații folosind matricea – conjugare, înmulțire, rang, transformare și altele. Doi vectori având același număr de elemente și egalitate de formă pot fi, de asemenea, utilizați pentru a efectua scăderea și adunarea.

2. Matricea simetrică

Matricea simetrică are importanță atât în ​​algebra liniară, cât și în învățarea automată. Matricele de algebră liniară sunt utilizate în principal pentru a transporta funcții. De cele mai multe ori, aceste funcții sunt simetrice, la fel și matricele care le corespund. Aceste funcții și valorile pe care le dețin pot fi utilizate pentru a măsura distanța caracteristică. Ele pot fi, de asemenea, utilizate pentru a măsura covarianța caracteristicilor. Mai jos sunt enumerate câteva proprietăți ale matricelor simetrice:

  • Matricele simetrice și inversul lor sunt ambele simetrice.
  • Toate valorile din valorile proprii sunt numere reale. Nu sunt prezente numere complexe.
  • O matrice simetrică se formează atunci când o matrice este înmulțită cu transpunerea ei.
  • Matricele simetrice dețin și proprietatea factorizării.
  • Pentru matricele care au coloane liniar independente, rezultatul când matricea este înmulțită cu transpunerea ei este inversabil.

3. Valori proprii și vector propriu

Vectorii proprii sunt vectori care se modifică doar printr-un factor scalar și nu există nicio schimbare în direcția lor. Valoarea proprie corespunzătoare vectorilor proprii este mărimea cu care aceștia sunt scalați. Valorile proprii și vectorii proprii se găsesc în bazele matematicii și calculului. Când trasăm un vector pe un grafic XY, acesta urmează o direcție specifică. Când aplicăm transformarea liniară pe câțiva vectori, vedem că aceștia nu își schimbă direcția. Acești vectori sunt foarte importanți în învățarea automată.

Valorile proprii și vectorii proprii sunt utilizați pentru a minimiza zgomotul de date. De asemenea, le putem folosi pe cele două pentru a îmbunătăți eficiența sarcinilor despre care se știe că sunt intensive din punct de vedere computațional. Ele pot fi, de asemenea, folosite pentru a elimina supraajustarea. Există și alte câteva scenarii în care valorile proprii și vectorii proprii se dovedesc utili.

Este destul de dificil să vizualizați caracteristicile datelor de sunet, text sau imagine. Aceste date sunt de obicei reprezentate în 3-D. Aici intră în imagine valorile proprii și vectorii proprii. Ele pot fi folosite pentru a capta toată cantitatea uriașă din care este stocată într-o matrice. Valorile proprii și vectorii proprii sunt utilizați și în recunoașterea facială.

Citiți: Idei de proiecte de învățare automată pentru începători

4. Analiza componentelor principale (PCA)

Există multe momente în care dimensionalitatea face lucrurile dificile atunci când vine vorba de rezolvarea anumitor probleme de învățare automată. În aceste probleme, avem de-a face cu date ale căror caracteristici au o corelație foarte mare între ele și sunt într-o dimensiune mai mare decât de obicei.

Problema care apare cu această problemă de dimensionalitate este că devine foarte dificil de înțeles influența pe care o are fiecare caracteristică asupra variabilei țintă. Acest lucru se întâmplă deoarece caracteristicile cu o corelație mai mare decât în ​​mod normal tind să influențeze ținta în același mod. De asemenea, este foarte dificil să vizualizați datele care se află într-o dimensiune superioară.

Analiza componentelor principale este soluția acestor probleme. Vă ajută să reduceți dimensiunea datelor la 2-D sau 3-D. Acest lucru se face asigurându-se că nicio informație nu este pierdută din cauza modificărilor variației maxime. Matematica din spatele PCA se referă la ortogonalitate. PCA este cea mai bună metodă disponibilă pentru a face modelul mai puțin complex prin reducerea numărului de caracteristici din setul de date.

Cu toate acestea, ar trebui să evitați să-l utilizați ca pas inițial pentru a elimina supraadaptarea. Ar trebui să începeți cu limitarea numărului de caracteristici din date sau creșterea cantității de date. Ar trebui să încercați apoi să utilizați regularizarea L1 sau L2. Dacă nimic nu funcționează, doar atunci ar trebui să apelați la PCA.

Citește și: Top 9 biblioteci de învățare automată despre care ar trebui să știi

De ce ar trebui să înveți algebra liniară înainte de învățarea automată?

1. Algebra liniară este cheia pentru a excela în învățarea automată

Nu se poate nega faptul că calculul depășește algebra liniară când vine vorba de matematică avansată. Calculul integral și diferențial vă ajută mult mai mult decât doar cu integrare, diferențiere și limite, ele servesc și ca cunoștințe fundamentale necesare pentru aplicații, cum ar fi tensorii și vectorii.

Învățarea acestor lucruri vă va ajuta să înțelegeți mai bine ecuațiile liniare și funcțiile liniare, printre alte domenii. Veți ști, de asemenea, despre concepte avansate, cum ar fi metoda Simplex și vectorii spațiali. Dacă aveți nevoie de ajutor cu programarea liniară, puteți utiliza metoda Simplex. Pentru a vă îmbunătăți aceste concepte, începeți prin a acorda mai mult timp algebrei liniare.

2. Predicția învățării automate

Când înveți algebră liniară, îmbunătățești conștientizarea sau instinctul care joacă un rol atât de important în învățarea automată. Acum veți putea oferi mai multe perspective. Matricele și vectorii pe care i-ați studiat vă vor ajuta să vă extindeți gândirea și să o faceți mai neclintită. Posibilitățile sunt nesfârșite. Ai putea începe să faci lucruri pe care ceilalți din jurul tău le vor fi foarte greu de înțeles. Puteți începe să vizualizați și să configurați diferite grafice. Puteți începe să utilizați mai mulți parametri pentru diferite componente de învățare automată.

3. Algebra liniară ajută la crearea unor algoritmi de învățare automată mai buni

Vă puteți folosi învățarea de algebră liniară pentru a construi algoritmi de învățare automată mai bine supravegheați, precum și nesupravegheați. Regresia logistică, regresia liniară, arborii de decizie și mașinile vectoriale suport (SVM) sunt câțiva algoritmi de învățare supravegheați pe care îi puteți crea de la zero cu ajutorul algebrei liniare.

Pe de altă parte, îl puteți folosi și pentru algoritmi nesupravegheați, inclusiv descompunerea unei singure valori (SVD), gruparea și analiza componentelor. Algebra liniară vă va ajuta să dezvoltați o înțelegere mai aprofundată a proiectului de învățare automată la care lucrați și, astfel, vă va oferi flexibilitatea de a personaliza diferiți parametri. Puteți afla mai multe despre regresia liniară în învățarea automată.

4. Algebră liniară pentru o mai bună procesare grafică în învățarea automată

Proiectele de învățare automată vă oferă diferite interpretări grafice la care să lucrați – imagini, audio, video și detectarea marginilor. Algoritmii de învățare automată au clasificatori care antrenează o parte din setul de date dat pe baza categoriilor lor. O altă sarcină a clasificatorilor este să elimine erorile din datele care au fost deja instruite.

În această etapă intervine algebra liniară pentru a ajuta la calcularea acestui set de date complex și mare. Utilizează tehnici de descompunere a matricei pentru a procesa și gestiona date mari pentru diferite proiecte. Cele mai populare metode de descompunere a matricei sunt descompunerea QR și LU.

5. Algebră liniară pentru a vă îmbunătăți interpretarea statisticilor

Statisticile sunt foarte importante pentru organizarea și integrarea datelor în învățarea automată. Dacă doriți să înțelegeți conceptele statistice într-un mod mai bun, mai întâi trebuie să știți cum funcționează algebra liniară. Algebra liniară are metode, operații și notații care pot ajuta la integrarea subiectelor statistice avansate, cum ar fi analiza multivariată, în proiectul dvs.

Să presupunem că lucrați la date despre pacient care includ greutatea, înălțimea, tensiunea arterială și ritmul cardiac. Acestea sunt variabilele multiple ale setului de date la care lucrați. Să presupunem aici că o creștere în greutate va duce la o creștere a tensiunii arteriale. Nu este prea greu de înțeles că aceasta este o relație liniară. Deci, pentru a înțelege mai bine cum o creștere a unei variabile o afectează pe cealaltă, va trebui să aveți o bună înțelegere a algebrei liniare.

Concluzie

Învățarea automată în sine este un subiect destul de vast; cu toate acestea, există și alte concepte, cum ar fi algebra liniară, care sunt la fel de importante de învățat ca și ML în sine. Învățarea algebrei liniare și a altor astfel de subiecte va ajuta la înțelegerea mai bună a conceptelor de învățare automată.

Dacă sunteți interesat să aflați mai multe despre învățarea automată, consultați Diploma PG de la IIIT-B și upGrad în Învățare automată și AI, care este concepută pentru profesioniști care lucrează și oferă peste 450 de ore de pregătire riguroasă, peste 30 de studii de caz și sarcini, IIIT- B Statut de absolvenți, peste 5 proiecte practice practice și asistență pentru locuri de muncă cu firme de top.

Ce este mai important pentru învățarea automată – calcul sau algebră liniară?

Dacă intenționați să vă construiți o carieră în învățarea automată, trebuie să știți deja că bazele acestui domeniu se află adânc în matematică. Matematica învățării automate constă din 3 domenii cheie, calcul, algebră liniară și statistică. Deoarece învățarea automată implică o mulțime de vectori și matrice, algebra liniară constituie părțile sale cele mai fundamentale. Dar calculul este, de asemenea, o parte integrantă a ML, deoarece ajută la înțelegerea modului în care funcționează mecanismul de învățare automată. Deci atât calculul cât și algebra liniară sunt la fel de importante. Cu toate acestea, cât de mult din ambele trebuie să folosiți depinde în primul rând de rolurile și responsabilitățile dvs.

Este algebra liniară mai greu de învățat decât calculul?

Algebra liniară se referă la studiul liniilor drepte folosind ecuații liniare, în timp ce calculul se referă la variarea lină a componentelor care implică derivate, vectori, integrale, curbe și multe altele. Acestea fiind spuse, algebra liniară este mult mai simplu de învățat decât calculul de bază. În algebra liniară, dacă puteți înțelege teoria din spatele teoremelor de algebră liniară, puteți rezolva toate întrebările conexe. Cu toate acestea, acest lucru nu este suficient pentru rezolvarea problemelor de calcul. Mai mult decât memorarea algoritmilor, adică partea de teorie, trebuie să înțelegeți aspectele computaționale pentru a răspunde la întrebările de calcul în calcul. Calculul este partea cea mai dificilă a matematicii, în timp ce algebra liniară este mai concretă și mai puțin abstractă; de acum încolo mai ușor de înțeles.

Sunt statisticile importante în învățarea automată?

Când vine vorba de învățarea automată, nu puteți lăsa statisticile din ea. Experții sunt de părere că învățarea automată este statistică aplicată, deci este o condiție prealabilă pentru cei care doresc să urmeze o carieră în învățarea automată. În proiectarea modelelor de învățare automată, datele joacă un rol fundamental esențial. Sunt necesare tehnici statistice pentru a găsi răspunsuri pe baza datelor acumulate care vor fi folosite pentru a antrena diferite modele de învățare automată. Prin urmare, o familiaritate de bază cu statisticile este obligatorie pentru învățarea automată.