Analiza liniară discriminantă pentru învățarea automată: ce trebuie să știți?

Publicat: 2020-05-22

Progresul tehnologic din ultimii ani a permis dispozitivelor conectate să gestioneze cantități masive de date. Cu toate acestea, stocarea și securitatea datelor rămân încă preocupări mari atunci când aveți de-a face cu cantități atât de uriașe de date. Acesta este motivul pentru care este foarte important să gestionați datele în mod corect. Poate fi adesea o sarcină care necesită timp.

Aici intervin tehnicile de reducere a dimensionalității datelor, cum ar fi analiza discriminantă liniară sau LDA . Aceste tehnici vă pot ajuta să gestionați seturile de date într-un mod mult mai bun, asigurând în același timp securitatea și confidențialitatea datelor. Accentul nostru în acest blog va fi pe discutarea tehnicii de reducere a dimensionalității datelor de analiză discriminantă liniară. Să începem prin a vorbi despre reducerea dimensionalității.

Cuprins

Ce este reducerea dimensionalității?

Veți putea înțelege mai bine tehnica analizei discriminante liniare dacă cunoașteți fundalul conceptului pe care se bazează. Când aveți de-a face cu date multidimensionale, aveți date care au o serie de caracteristici care sunt corelate între ele. Dacă trasăm date multidimensionale în două sau trei dimensiuni, folosim tehnica de reducere a dimensionalității.

O alternativă care este, de asemenea, destul de frecvent utilizată ca înlocuitor pentru reducerea dimensionalității este reprezentarea datelor folosind histograme, diagrame de dispersie și diagrame cu case, printre altele. Aceste grafice pot fi folosite pentru a găsi modele într-un set dat de date brute. Cu toate acestea, diagramele nu prezintă datele într-un mod ușor de descifrat pentru oamenii obișnuiți. De asemenea, datele cu multe caracteristici ar avea nevoie de mai multe diagrame pentru a identifica modelele din acel set de date.

Tehnicile de reducere a dimensionalității datelor, cum ar fi LDA, ajută la depășirea acestor preocupări prin utilizarea a două sau trei dimensiuni pentru trasarea datelor. Acest lucru vă va permite să fiți mai explicit în prezentarea datelor, ceea ce va avea sens chiar și pentru acele persoane care nu au cunoștințe tehnice.

Citiți: 25 de întrebări și răspunsuri la interviu de învățare automată

Ce este analiza discriminantă liniară?

Este una dintre cele mai utilizate tehnici de reducere a dimensionalității. Este folosit în învățarea automată, precum și în aplicații care au legătură cu clasificarea tiparelor. LDA servește un scop foarte specific, care este de a proiecta caracteristici care există într-un spațiu dimensional înalt în spațiu la o dimensiune inferioară.

Acest lucru este făcut pentru a elimina problemele comune de dimensionalitate și pentru a reduce costurile și resursele dimensionale. Ronald A Fisher deține meritul pentru dezvoltarea conceptului original în 1936 – Fisher’s Discriminant Analysis sau Linear Discriminant . Inițial, discriminantul liniar era o tehnică cu două clase. Versiunea cu mai multe clase a apărut mai târziu.

Analiza discriminantă liniară este o metodă de clasificare supravegheată care este utilizată pentru a crea modele de învățare automată. Aceste modele bazate pe reducerea dimensionalității sunt utilizate în aplicație, cum ar fi analiza predictivă de marketing și recunoașterea imaginii, printre altele. Vom discuta despre aplicații puțin mai târziu.

Deci, ce căutăm exact cu LDA? Există două domenii pe care această tehnică de reducere a dimensionalității le ajută să le descopere – Parametrii care pot fi utilizați pentru a explica relația dintre un grup și un obiect – Modelul preceptor de clasificare care poate ajuta la separarea grupurilor. Acesta este motivul pentru care LDA este utilizat pe scară largă pentru a modela soiuri din diferite grupuri. Deci, puteți folosi această tehnică pentru a utiliza două sau mai mult de două clase pentru distribuția unei variabile.

Extensii la analiza discriminantă liniară

LDA este considerată una dintre cele mai simple și mai eficiente metode disponibile pentru clasificare. Deoarece metoda este atât de simplă și ușor de înțeles, avem câteva variante, precum și extensii disponibile pentru aceasta. Unele dintre acestea includ:

1. Analiza discriminantă regulată sau RDA

RDA este utilizat pentru a aduce regularizarea în estimarea varianței sau covarianței. Acest lucru se face pentru a modera impactul pe care variabilele îl au asupra LDA.

2. Analiza discriminantă cuadratică sau QDA

În QDA, diferite clase folosesc propria estimare a varianței. În cazul în care numărul variabilei de intrare este mai mare decât de obicei, fiecare clasă folosește estimarea covarianței sale.

3. Analiză discriminantă flexibilă sau FDA

FDA folosește intrări cu combinații neliniare. Splinele sunt un bun exemplu.

Aflați despre: Idei și subiecte pentru proiecte Python

Aplicații comune LDA

LDA își găsește utilizarea în mai multe aplicații. Poate fi folosit în orice problemă care poate fi transformată într-o problemă de clasificare. Exemplele comune includ recunoașterea vitezei, recunoașterea feței, chimia, clasificarea datelor cu microarray, recuperarea imaginilor, biometria și bioinformatica pentru a numi câteva. Să discutăm câteva dintre acestea.

1. Recunoașterea feței

În viziunea computerizată, recunoașterea feței este considerată una dintre cele mai populare aplicații. Recunoașterea feței se realizează prin reprezentarea fețelor folosind cantități mari de valori pixeli. LDA este utilizat pentru a reduce numărul de caracteristici pentru a pregăti motivele pentru utilizarea metodei de clasificare. Noile dimensiuni sunt combinații de valori de pixeli care sunt utilizate pentru a crea un șablon.

2. Identificarea clientului

Dacă doriți să identificați clienții pe baza probabilității ca aceștia să cumpere un produs, puteți utiliza LDA pentru a colecta caracteristicile clienților. Puteți identifica și alege acele caracteristici care descriu grupul de clienți care prezintă șanse mai mari de a cumpăra un produs.

3. Medical

LDA poate fi folosit pentru a clasifica bolile în diferite categorii, cum ar fi severe, ușoare sau moderate. Există câțiva parametri ai pacienților care vor intra în realizarea acestei sarcini de clasificare. Această clasificare permite medicilor să definească ritmul tratamentului.

Citește și: 15 idei interesante de proiecte de învățare automată pentru începători

Concluzie

LDA este o tehnică simplă și bine înțeleasă care este utilizată în mod obișnuit în modelele de clasificare ML. PCA și regresia logistică sunt alte tehnici de reducere a dimensionalității disponibile pentru noi. Dar când vine vorba de probleme speciale de clasificare, LDA este preferată față de celelalte două.

Dacă sunteți interesat să aflați mai multe despre învățarea automată, consultați Diploma PG de la IIIT-B și upGrad în Învățare automată și AI, care este concepută pentru profesioniști care lucrează și oferă peste 450 de ore de pregătire riguroasă, peste 30 de studii de caz și sarcini, IIIT- B Statut de absolvenți, peste 5 proiecte practice practice și asistență pentru locuri de muncă cu firme de top.

Ce este analiza discriminantă liniară?

Analiza discriminantă liniară (LDA) este un algoritm de clasificare pentru a afla caracteristicile de bază care sunt bune pentru a discrimina un grup de eșantioane din toate celelalte grupuri. Ca rezultat al aplicării algoritmului LDA, obținem un nou set de caracteristici care poate fi utilizat pentru predicția apartenenței la grup. De exemplu, să presupunem că colectați adrese IP și doriți să vă dați seama cărei țări aparțin. Aveți un set de antrenament de exemple de adrese IP și puteți identifica țara de origine cu o precizie foarte mare. Dacă aveți o nouă adresă IP și doriți să știți din ce țară provine, o puteți da unui LDA și acesta o va atribui clasei cu cea mai mare probabilitate.

Care sunt aplicațiile analizei discriminante liniare?

Analiza discriminantă liniară (LDA) este un set de tehnici din cadrul de învățare supravegheată. LDA este o metodă în care variabila dependentă este separabilă liniar în spațiul caracteristicilor. LDA este utilizat în marketing, finanțe și alte domenii pentru a efectua o serie de sarcini de clasificare, cum ar fi profilarea clienților și detectarea fraudei. De exemplu, să considerăm că dorim să găsim o combinație liniară de variabile independente care separă două grupuri de puncte de date. LDA găsește o combinație liniară a variabilelor independente care produce separarea maximă între cele două grupuri de puncte de date din spațiul caracteristic.

Ce este reducerea dimensionalității?

Reducerea dimensionalității se referă la o colecție de tehnici pentru reducerea numărului de variabile dintr-un set de date. Cea mai comună tehnică de reducere a dimensionalității este analiza componentelor principale (PCA). PCA este cea mai populară tehnică de reducere a dimensionalității datorită simplității, eleganței matematice și proprietăților statistice ridicate. PCA este utilizat pentru a reduce dimensionalitatea unui set de date prin identificarea axei care conține cea mai mare varianță împreună cu cele mai puține erori.