Regresia izotonică în învățarea automată: înțelegerea regresiilor în învățarea automată

Publicat: 2020-12-21

Există diferite tipuri de modele de regresie (algoritmi) care sunt utilizate pentru a antrena programe de învățare automată, cum ar fi regresia liniară, logistică, ridge și lasso. Dintre acestea, modelul de regresie liniară este cel mai de bază și cel mai utilizat model de regresie. Regresia izotonică în învățarea automată se bazează pe regresia liniară. Prin urmare, înainte de a trece la regresia izotonică, să aruncăm o privire mai întâi la regresia liniară în învățarea automată.

Cuprins

Înțelegerea regresiei liniare în învățarea automată
Înțelegerea regresiei izotonice în învățarea automată
- 1. Model liniar pe bucăți
- 2. Pantă nenegativă
Avantajele utilizării regresiei izotonice în modelele de învățare automată
- 1. Scalare multidimensională
- 2. Calibrarea Valorilor Probabilității
Dezavantajele utilizării regresiei izotonice în modelele de învățare automată
- Risc de supraadaptare
Concluzie
De ce este regresia semnificativă în învățarea automată?
Învățarea automată este aceeași cu știința datelor?
Este învățarea automată la fel cu învățarea profundă?

Înțelegerea regresiei liniare în învățarea automată

Sursă

Modelul de regresie liniară este utilizat pentru a determina relația dintre variabilele dependente și independente. Se presupune o relație liniară, reprezentată de linia de cea mai bună potrivire, între cele două variabile. Ecuația y= mx + c + e este folosită pentru a desemna modelul de regresie liniară în care:

m= panta dreptei

c= interceptare

e= eroare în model

Modelul de regresie liniară este susceptibil la valori aberante, extrem de inflexibil și, prin urmare, nu poate fi utilizat pentru date de dimensiuni mari. Când acest model este implementat pe date de testare de mare dimensiune, există mai multe instanțe care se află în afara pantei liniei, numite și erori reziduale. Metode precum regularizarea L1 și L2 pot fi folosite pentru a reduce abruptul pantei liniei, dar nu se dovedesc la fel de utile.

Trebuie citit: Modelele de învățare automată explicate

Acest lucru limitează acuratețea algoritmului de învățare automată. O nouă abordare a regresiei izotonice în învățarea automată este adoptată pentru a depăși această limită. Deși nu este răspândită în prezent, această abordare este foarte puternică și poate ajuta la îmbunătățirea acurateței programului de învățare automată.

Înțelegerea regresiei izotonice în învățarea automată

Înainte de a aborda aspectele tehnice, să înțelegem regresia izotonică în învățarea automată în termeni profani.

Să începem prin a decoda cuvântul „izotonic”. Cuvântul „izotonic” are origini ale cuvintelor rădăcină grecească, formate din două părți, „iso” și „tonic”. Aici, „iso” înseamnă egal și „tonic” înseamnă întindere. În ceea ce privește algoritmii de învățare automată, regresia izotonică poate fi, prin urmare, înțeleasă ca întindere egală de-a lungul liniei de regresie liniară. Funcționează pe deasupra unui model de regresie liniară.

Să aruncăm o privire asupra diferitelor aspecte legate de regresia izotonică care ne vor ajuta să o înțelegem mai bine.

1. Model liniar pe bucăți

După cum sa menționat mai devreme, abruptul pantei dreptei de regresie liniară trebuie redus la minimum, pentru care sunt utilizate metodele de regularizare L1 și L2. Abordarea regresiei izotonice este complet diferită prin împărțirea graficului în secțiuni pe bucăți prin crearea de praguri și având o linie liniară pentru fiecare secțiune conectată cap la cap.

De exemplu, în imaginea de mai sus, axa X poate fi împărțită în mai multe secțiuni mai mici, să zicem la intervale egale de 10. Fiecare dintre aceste intervale poate fi numit bins, cum ar fi bin1, bin2, bin3, bin4 și așadar. pe. Prin urmare, ecuația liniară devine acum,

y= m1x1 + m2x2 + m3x3 +….. mnxn + c, unde:

m1, m2, m3….mn = panta liniei pentru containere individuale.

Acest lucru ajută la minimizarea erorii și la reducerea pantei liniei de cea mai bună potrivire.

2. Pantă nenegativă

Deoarece o funcție izotonă este o funcție monotonă, panta soluției este întotdeauna nenegativă. O scădere a pantei nu este permisă la trecerea de la un prag la altul. Cel mai jos punct dintr-un prag ar trebui să fie întotdeauna mai mare decât cel mai înalt punct din pragul anterior.

De exemplu, fie x1, x2, x3, x4…xn valorile punctelor de date luate în considerare pentru panta din binurile b1, b2, b3, b4…bn. Apoi, conform regulei, panta ar trebui să fie nenegativă. Prin urmare,

f(x1) <= f(x2) <= f(x3) <= f(x4)…<= f(xn).

Deci, începem cu un punct inferior (unde f(x1) este punctul cel mai de jos) și trecem treptat la un punct superior cu fiecare prag. Panta unui prag poate fi zero (linie orizontală), dar nu poate fi niciodată negativă (pantă descendentă).

Citiți: Idei de proiecte de învățare automată pentru începători

Avantajele utilizării regresiei izotonice în modelele de învățare automată

Utilizarea regresiei izotonice oferă două beneficii majore, care sunt discutate mai jos.

1. Scalare multidimensională

Regresia izotonică este foarte utilă dacă aveți mai multe variabile de intrare. Putem inspecta fiecare dimensiune ca fiecare funcție și să o interpolăm într-un mod liniar. Acest lucru permite o scalare multidimensională ușoară.

2. Calibrarea Valorilor Probabilității

În regresia logistică, să presupunem că avem o variabilă x și notăm o probabilitate p(1) în care valoarea probabilității pentru variabilă nu crește. Dar, în realitate, valoarea probabilității este mai mare în lumea reală. În astfel de cazuri, în scopuri de calibrare sau de creștere a probabilității unor astfel de variabile, regresia izotonică se dovedește de mare ajutor.

Consultați: Întrebări de interviu pentru învățare automată

Dezavantajele utilizării regresiei izotonice în modelele de învățare automată

Există un dezavantaj major al utilizării regresiei izotonice, care este discutat mai jos.

Risc de supraadaptare

Există un risc semnificativ de supraadaptare a hiperparametrului (K) pe măsură ce numărul de constrângeri izotonice și de caracteristici de predictor crește, dar metoda fluxului de lucru de validare încrucișată poate fi utilizată pentru a gestiona problema.

Concluzie

În prezent, doar trei limbi majore au pachete open-source cu regresie izotonică. Cu toate acestea, analizând beneficiile utilizării regresiei izotonice în problemele de învățare automată , domeniul de aplicare, utilizarea și disponibilitatea pachetelor de regresie izotonică vor crește cu siguranță în viitor.

Putem vedea că regresia izotonică înlocuiește în principal regresia liniară și metodele de normalizare L1 și L2. Prin urmare, pentru a fi pregătit pentru viitor, este necesar să vă mențineți actualizat și informat despre regresia izotonică de acum!

Dacă sunteți interesat să aflați mai multe despre regresia izotonică în învățarea automată sau alte concepte legate de învățarea automată, puteți consulta IIIT-B și upGrad’s PG Diploma in Machine Learning și AI , care este cel mai bine vândut program din India, cu o evaluare de 4,5 stele. . Cursul are peste 450 de ore de învățare, peste 30 de studii de caz și sarcini și îi ajută pe studenți să învețe abilități solicitate legate de învățarea automată și AI.

De ce este regresia semnificativă în învățarea automată?

Analiza regresiei, un fel de algoritm de învățare supravegheată, este unul dintre conceptele fundamentale în învățarea automată. Regresia este utilizată pentru a stabili relația dintre diferite variabile încercând să estimeze modul în care valoarea uneia o influențează pe cea a celeilalte. În domeniul învățării automate, regresia cuprinde algoritmi matematici complecși care ajută la estimarea rezultatelor unei variabile țintă specifice pe baza valorilor în continuă schimbare ale uneia sau mai multor variabile predictoare. Cel mai popular tip de analiză de regresie este regresia liniară, deoarece este foarte ușor de utilizat pentru a face prognoze și predicții.

Învățarea automată este aceeași cu știința datelor?

Cuvintele la modă precum știința datelor și învățarea automată devin populare astăzi, mulți oameni se simt adesea confuzi cu privire la ceea ce înseamnă de fapt. Să încercăm să explicăm aici rapid. Știința datelor se referă la studiul unor volume masive de date generate de organizații. Oamenii de știință de date folosesc diverse tehnici pentru a dezvălui informații valoroase din aceste date, astfel încât companiile să poată obține beneficii maxime și să rămână în fața concurenței. Învățarea automată este diferită de știința datelor; folosește tehnici de știință a datelor pentru a învăța despre date care sunt apoi folosite pentru a antrena mașini. Învățarea automată folosește modele matematice complexe pentru a ajuta computerele să învețe fără intervenția umană.

Este învățarea automată la fel cu învățarea profundă?

Învățarea automată este un subset al inteligenței artificiale. Folosește algoritmi sau modele care pot analiza datele, învăța din acestea și apoi aplică acele învățături pentru a ajuta computerele sau mașinile să ia decizii fără intervenții umane explicite. Pe de altă parte, învățarea profundă este un subdomeniu al învățării automate. Este folosit pentru a structura algoritmi sau modele matematice în straturi pentru a dezvolta o rețea neuronală artificială care seamănă cu structura creierului uman. Această rețea neuronală poate învăța singură și poate lua decizii inteligente folosind propriul cadru logic și analizând date.