Regresia liniară vs. Regresia logistică: diferența dintre regresia liniară și regresia logistică
Publicat: 2020-09-10Lumea învățării automate nu ar fi completă fără prezența a doi dintre cei mai simpli algoritmi de învățare automată. Da, atât regresia liniară, cât și regresia logistică sunt cei mai simpli algoritmi de învățare automată pe care îi puteți implementa. Înainte de a discuta oricare dintre diferențele dintre regresia liniară și cea logistică, trebuie mai întâi să înțelegem elementele de bază pe care se pune bazele ambilor algoritmi.
În primul rând, ambii acești algoritmi sunt învățarea supravegheată în natură. Adică, datele pe care le vei introduce în ambii algoritmi ar trebui să fie bine etichetate. Un alt lucru critic de remarcat sunt cazurile de utilizare. De la început, o diferență evidentă între acești doi algoritmi este cazurile de utilizare ale ambilor. Regresia liniară este folosită ori de câte ori dorim să efectuăm regresia. Adică, folosim regresia liniară ori de câte ori dorim să prezicem numere continue, cum ar fi prețurile caselor dintr-o anumită zonă.
Cu toate acestea, utilizarea regresiei logistice se face în probleme de clasificare. Adică, dacă vrem să prezicem dacă o anumită casă este scumpă sau ieftină (în loc de preț), folosim algoritmul de regresie logistică. Da, chiar dacă regresia logistică are cuvântul regresie în numele său, este folosită pentru clasificare.
Există mai multe astfel de subtilități interesante pe care le veți găsi enumerate mai jos. Dar înainte de a compara frontal regresia liniară cu regresia logistică, mai întâi să aflăm mai multe despre fiecare dintre acești algoritmi.
Cuprins
Regresie liniara
Regresia liniară este cel mai simplu și mai simplu algoritm de învățare automată de înțeles și implementat. Este un algoritm de învățare supravegheată, așa că dacă dorim să prezicăm valorile continue (sau să efectuăm regresia), ar trebui să servim acestui algoritm cu un set de date bine etichetat. Acest algoritm de învățare automată este cel mai simplu datorită naturii sale lineare. Pentru a prezice cu succes valorile viitoare, regresia liniară încearcă să facă o linie dreaptă prin datele introduse în algoritm.
Deci, ori de câte ori orice informație este introdusă într-un algoritm de regresie liniară, acesta preia datele și ia ecuația unei linii drepte, selectând aleatoriu panta și interceptarea până când găsește linia cea mai potrivită. Dacă datele pe care le introducem în acest algoritm conțin doar o singură variabilă independentă, atunci se numește regresie liniară simplă.

Pe de altă parte, dacă datele au mai multe variabile independente, atunci regresia devine o regresie liniară multiplă. Forma matematică a regresiei liniare este pur și simplu cea a unei linii drepte, care este prezentată mai jos.
y= a0+a1x+ c
Aici, y este variabila dependentă, a0 și a1 sunt coeficientul pe care acest algoritm trebuie să-l găsească, x este variabila dependentă și c este valoarea de interceptare a acestei linii drepte.
Regresie logistică
Este inutil să spunem că regresia logistică este unul dintre cei mai simpli, dar foarte puternici algoritmi de învățare automată de clasificare sub umbrela unui algoritm de învățare supravegheată. Acest algoritm poate fi folosit pentru probleme de regresie, dar este folosit mai ales pentru a rezolva probleme de clasificare. Ieșirea pe care o obținem de la acest algoritm este întotdeauna între 0 și 1, datorită căruia devine fără efort clasificarea instanțelor în clase folosind o valoare de clasificare de prag.

Cuvântul logistic din nume se referă la funcția de activare, care este folosită în această regresie. Funcția de activare sau funcția logistică, în acest caz, nu este de fapt altceva decât funcția sigmoidă. Este proprietatea acestei funcții sigmoide, care păstrează valoarea regresiei logistice întotdeauna între zero și unu. Funcția sigmoidă arată cam așa:
Aici, y este rezultatul prin funcția sigmoid, iar x este variabila independentă. În cazul regresiei logistice, variabila x ar fi de fapt întreaga ecuație de regresie liniară. Prin urmare, se poate dezvolta ecuația pentru regresia logistică, care este scrisă mai jos:
Aici, semnificația variabilelor este similară cu cea din regresia logistică, x este variabila independentă, iar y este variabila dependentă, b0, b1, b2 etc., sunt coeficientul pe care îl determină acest algoritm.

Diferența dintre regresia liniară și cea logistică
Listate mai jos, veți găsi o comparație cuprinzătoare a regresiei liniare față de regresia logistică una lângă alta:
REGRESIE LINIARA | REGRESIE LOGISTICĂ |
Necesită date bine etichetate, ceea ce înseamnă că are nevoie de supraveghere și este folosit pentru regresie. Astfel, regresia liniară este un algoritm de regresie supravegheată. | De asemenea, necesită ca datele care sunt introduse în el să fie bine etichetate. Cu toate acestea, acest algoritm este utilizat pentru clasificare în loc de regresie. Deci regresia logistică este un algoritm de clasificare supravegheat. |
Predicția obținută prin algoritmul de regresie liniară este de obicei o valoare care poate fi în intervalul de la infinit negativ la infinit pozitiv. | Predicția care este obținută prin regresia logistică este de fapt în intervalul de la zero la unu. Această caracteristică permite o clasificare ușoară cu ajutorul unei valori de prag. |
Regresia liniară nu necesită o funcție de activare. | Aici avem nevoie de o funcție de activare. În acest caz, acea funcție este funcția sigmoidă. |
Nu există o valoare de prag în regresia liniară. | În regresia logistică, este necesară o valoare de prag pentru a determina în mod corespunzător clasele fiecărei instanțe. |
Variabila dependentă în cazul regresiei liniare trebuie să fie de natură continuă. Înseamnă că nu putem trece în variabila, care este categoric și așteptăm o valoare continuă în predicție. | Variabila dependentă în cazul regresiei logistice trebuie să fie categorică. Înseamnă că ar trebui să aibă diferite categorii (nu mai mult de două). |
Scopul acestui algoritm este de a găsi linia de cea mai bună potrivire prin punctele de date de antrenament. Astfel, linia dreaptă rezultată, pe care o trasăm, ar trebui să atingă aproape toate punctele de antrenament dacă potrivirea nu este nici peste, nici sub. | Dacă facem vreo modificare a coeficientului curbei de regresie logistică, atunci întregul grafic al acesteia și-ar schimba forma. |
Pentru prezicerea valorilor, algoritmul de regresie liniară face o presupunere fundamentală. Se presupune că valorile care sunt trecute în acest algoritm urmează distribuția normală standard sau sunt distribuite în conformitate cu distribuția gaussiană. | Algoritmul de regresie logistică face, de asemenea, o presupunere a distribuției datelor care sunt transmise în funcția sigmoidă. Se presupune că datele urmează distribuția binomială. |
Doriți să aflați mai multe?
Dacă sunteți interesat să aflați mai multe despre învățarea automată, consultați Diploma PG de la IIIT-B și upGrad în Învățare automată și AI, care este concepută pentru profesioniști care lucrează și oferă peste 450 de ore de pregătire riguroasă, peste 30 de studii de caz și sarcini, IIIT- B Statut de absolvenți, peste 5 proiecte practice practice și asistență pentru locuri de muncă cu firme de top.
Care sunt dezavantajele utilizării regresiei logistice?
Un model de regresie logistică anticipează o variabilă dependentă de date prin examinarea conexiunii dintre una sau mai multe variabile independente preexistente. Regresia logistică, care este folosită în mod obișnuit pentru sarcinile de clasificare, are numeroase avantaje, dar are și unele dezavantaje. Când lucrați cu seturi de date cu dimensiuni mari, poate apărea o supraadaptare a modelului, ceea ce duce la concluzii inexacte. Deoarece pregătirea datelor este o procedură care necesită timp atunci când se utilizează regresia logistică, întreținerea datelor devine și ea dificilă. Unul dintre dezavantajele majore ale regresiei logistice este că nu poate face față problemelor neliniare.
Ce se înțelege prin regresie logistică multinomială?
Regresia logistică multinomială este o extensie de regresie logistică binară care poate gestiona mai mult de două variabile dependente sau de rezultat. Este similar cu regresia logistică, cu excepția faptului că există mai multe rezultate posibile decât unul singur. Este o abordare tradițională de învățare automată supravegheată, cu capacități de clasificare în mai multe clase. Modelul logistic multinomial include diverse ipoteze, dintre care una este că datele sunt considerate a fi specifice cazului, ceea ce înseamnă că fiecare variabilă independentă are o singură valoare pentru fiecare instanță. Modelul logistic multinomial postulează, de asemenea, că, în orice scenariu dat, variabila dependentă nu poate fi prezisă cu precizie din variabilele independente.
Cum poate fi folosită regresia liniară pentru a rezolva probleme din viața reală?
Regresia liniară este utilizată pe scară largă într-o varietate de situații și sectoare din lumea reală. Companiile folosesc de obicei regresia liniară pentru a înțelege relația dintre publicitate, cheltuieli și profit. Cercetătorii medicali folosesc frecvent regresia liniară pentru a examina asocierea dintre doza de medicament și tensiunea arterială a pacientului. Oamenii de știință din agricultură folosesc frecvent regresia liniară pentru a evalua influența îngrășămintelor și a apei asupra randamentului culturilor. Astfel, utilizările regresiei liniare sunt variate în rezolvarea problemelor din viața reală.