6 tipuri de modele de regresie în învățarea automată despre care ar trebui să știți

Publicat: 2020-07-27

Cuprins

Introducere

Regresia liniară și regresia logistică sunt două tipuri de tehnici de analiză a regresiei care sunt utilizate pentru a rezolva problema regresiei folosind învățarea automată. Sunt cele mai proeminente tehnici de regresie. Dar, există multe tipuri de tehnici de analiză de regresie în învățarea automată, iar utilizarea lor variază în funcție de natura datelor implicate.

Acest articol va explica diferitele tipuri de regresie în învățarea automată și în ce condiții pot fi utilizate fiecare dintre ele. Dacă sunteți nou în învățarea automată, acest articol vă va ajuta cu siguranță să înțelegeți conceptul de modelare a regresiei.

Ce este analiza de regresie?

Analiza regresiei este o tehnică de modelare predictivă care analizează relația dintre variabila țintă sau dependentă și variabila independentă dintr-un set de date. Diferitele tipuri de tehnici de analiză de regresie sunt utilizate atunci când variabilele țintă și independente arată o relație liniară sau neliniară între ele, iar variabila țintă conține valori continue. Tehnica de regresie este utilizată în principal pentru a determina puterea predictorului, tendința de prognoză, seria temporală și, în cazul relației cauză-efect.

Analiza regresiei este tehnica principală de rezolvare a problemelor de regresie în învățarea automată folosind modelarea datelor. Aceasta implică determinarea celei mai bune linii de potrivire, care este o linie care trece prin toate punctele de date astfel încât distanța liniei de la fiecare punct de date să fie minimizată.

Tipuri de tehnici de analiză de regresie

Există multe tipuri de tehnici de analiză de regresie , iar utilizarea fiecărei metode depinde de numărul de factori. Acești factori includ tipul de variabilă țintă, forma liniei de regresie și numărul de variabile independente.

Mai jos sunt diferitele tehnici de regresie:

Regresie liniara
Regresie logistică
Regresia crestei
Regresia Lasso
Regresia polinomială
Regresia liniară bayesiană

Diferitele tipuri de regresie în tehnicile de învățare automată sunt explicate mai jos în detaliu:

1. Regresia liniară

Regresia liniară este unul dintre cele mai de bază tipuri de regresie în învățarea automată . Modelul de regresie liniară constă dintr-o variabilă predictor și o variabilă dependentă legate liniar între ele. În cazul în care datele implică mai multe variabile independente, atunci regresia liniară se numește modele de regresie liniară multiplă.

Ecuația de mai jos este utilizată pentru a desemna modelul de regresie liniară:

y=mx+c+e

unde m este panta dreptei, c este o intersecție și e reprezintă eroarea din model.

Sursă

Cea mai bună linie de potrivire este determinată prin variarea valorilor lui m și c. Eroarea predictorului este diferența dintre valorile observate și valoarea prezisă. Valorile lui m și c sunt selectate în așa fel încât să ofere eroarea minimă a predictorului. Este important de reținut că un model de regresie liniară simplă este susceptibil la valori aberante. Prin urmare, nu ar trebui utilizat în cazul datelor de dimensiuni mari.

2. Regresia logistică

Regresia logistică este unul dintre tipurile de tehnică de analiză a regresiei, care este folosită atunci când variabila dependentă este discretă. Exemplu: 0 sau 1, adevărat sau fals, etc. Aceasta înseamnă că variabila țintă poate avea doar două valori, iar o curbă sigmoidă denotă relația dintre variabila țintă și variabila independentă.

Funcția Logit este utilizată în regresia logistică pentru a măsura relația dintre variabila țintă și variabilele independente. Mai jos este ecuația care denotă regresia logistică.

logit(p) = ln(p/(1-p)) = b0+b1X1+b2X2+b3X3….+bkXk

unde p este probabilitatea de apariție a caracteristicii.

Sursă

Pentru selectarea regresiei logistice, ca tehnică de analist de regresie, trebuie remarcat, dimensiunea datelor este mare, cu apariția aproape egală a valorilor care urmează să apară în variabilele țintă. De asemenea, nu ar trebui să existe multicoliniaritate, ceea ce înseamnă că nu ar trebui să existe o corelație între variabilele independente din setul de date.

3. Regresia crestei

Sursă

Acesta este un alt tip de regresie în învățarea automată, care este de obicei utilizat atunci când există o corelație ridicată între variabilele independente. Acest lucru se datorează faptului că, în cazul datelor multi-coliniare, estimările celor mai mici pătrați dau valori imparțial. Dar, în cazul în care coliniaritatea este foarte mare, poate exista o anumită valoare de părtinire. Prin urmare, o matrice de prejudecată este introdusă în ecuația regresiei Ridge. Aceasta este o metodă de regresie puternică în care modelul este mai puțin susceptibil la supraadaptare.

Mai jos este ecuația folosită pentru a desemna regresia Ridge, unde introducerea lui λ (lambda) rezolvă problema multicolinearității:

β = (X^{T}X + λ*I)^{-1}X^{T}y

Consultați: 5 aplicații revoluționare ale învățării automate

4. Regresia lazo

Regresia Lasso este unul dintre tipurile de regresie din învățarea automată care efectuează regularizarea împreună cu selecția caracteristicilor. Interzice dimensiunea absolută a coeficientului de regresie. Ca rezultat, valoarea coeficientului se apropie de zero, ceea ce nu se întâmplă în cazul regresiei Ridge.

Din acest motiv, selecția caracteristicilor este utilizată în Regresia Lasso, care permite selectarea unui set de caracteristici din setul de date pentru a construi modelul. În cazul regresiei Lasso, sunt folosite doar caracteristicile necesare, iar celelalte sunt făcute zero. Acest lucru ajută la evitarea supraajustării în model. În cazul în care variabilele independente sunt foarte coliniare, atunci regresia Lasso alege o singură variabilă și face ca alte variabile să se micșoreze la zero.

Sursă

Mai jos este ecuația care reprezintă metoda regresiei Lasso:

N^{-1}Σ^{N}_{i=1}f(x_{i}, y_{I}, α, β)

5. Regresia polinomială

Regresia polinomială este un alt tip de tehnici de analiză a regresiei în învățarea automată, care este la fel cu regresia liniară multiplă cu o mică modificare. În regresia polinomială, relația dintre variabilele independente și dependente, adică X și Y, se notează cu gradul n.

Este un model liniar ca estimator. Metoda celui mai mic pătrat al mediei este folosită și în regresia polinomială. Cea mai bună linie din regresia polinomială care trece prin toate punctele de date nu este o linie dreaptă, ci o linie curbă, care depinde de puterea lui X sau de valoarea lui n.

Sursă

În timp ce încearcă să reducă eroarea medie pătratică la minim și să obții cea mai bună linie de potrivire, modelul poate fi predispus la supraadaptare. Se recomandă analizarea curbei spre final, deoarece polinoamele superioare pot da rezultate ciudate la extrapolare.

Ecuația de mai jos reprezintă regresia polinomială:

l = β0+ β0x1+ε

Citiți: Idei de proiecte de învățare automată

6. Regresia liniară bayesiană

Regresia Bayesiană este unul dintre tipurile de regresie din învățarea automată care utilizează teorema Bayes pentru a afla valoarea coeficienților de regresie. În această metodă de regresie, distribuția posterioară a caracteristicilor este determinată în loc de găsirea celor mai mici pătrate. Regresia liniară bayesiană este ca atât regresia liniară, cât și regresia de creasta, dar este mai stabilă decât regresia liniară simplă.

Sursă

Învață Cursuri AI și ML online de la cele mai bune universități din lume – Master, Programe Executive Postuniversitare și Program de Certificat Avansat în ML și AI pentru a-ți accelera cariera.

Concluzie

În plus față de metodele de regresie de mai sus, există multe alte tipuri de regresie în învățarea automată , inclusiv regresia netă elastică, regresia JackKnife, regresia în trepte și regresia ecologică.

Aceste diferite tipuri de tehnici de analiză de regresie pot fi utilizate pentru a construi modelul în funcție de tipul de date disponibile sau de cea care oferă acuratețea maximă. Puteți explora mai mult aceste tehnici sau puteți parcurge cursul de învățare supravegheată pe site- ul nostru .

Dacă sunteți interesat să aflați mai multe despre învățarea automată, consultați Programul Executive PG de la IIIT-B și upGrad în Învățare automată și IA, care este conceput pentru profesioniști care lucrează și oferă peste 450 de ore de pregătire riguroasă, peste 30 de studii de caz și sarcini, IIIT -B Statut de absolvenți, peste 5 proiecte practice practice și asistență pentru locuri de muncă cu firme de top.

Care sunt diferitele tipuri de regresie?

Există 5 tipuri de regresie, adică 1. regresia liniară, 2. regresia logistică, 3. regresia crestei, 4. regresia lazo, 5. regresia polinomială sunt diferitele tipuri de regresie

Ce este regresia? Care sunt tipurile de regresii?

Regresia este o tehnică de învățare automată supravegheată care este utilizată pentru a prezice valori continue. Scopul final al algoritmului de regresie este de a reprezenta o linie de cea mai bună potrivire sau o curbă între date și regresia liniară, regresia logistică, regresia crestei, regresia Lasso, regresia polinomială sunt tipuri de regresie.

Când ar trebui să folosesc analiza de regresie?

Analiza de regresie este utilizată atunci când doriți să preziceți o variabilă dependentă continuă dintr-un număr de variabile independente. Dacă variabila dependentă este dihotomică, atunci trebuie utilizată regresia logistică.