Cum funcționează învățarea automată nesupravegheată?

Publicat: 2018-06-13

Învățarea nesupravegheată se referă la formarea unui sistem AI folosind informații care nu sunt clasificate sau etichetate. Ceea ce înseamnă în mod ideal este că algoritmul trebuie să acționeze asupra informațiilor fără nicio îndrumare prealabilă.
În învățarea nesupravegheată, mașina grupează informații nesortate/neordonate privind asemănările și diferențele. Acest lucru se face fără furnizarea de categorii pentru ca mașina să clasifice datele în categorii. Sistemele care utilizează o astfel de învățare sunt în general asociate cu modelul de învățare generativă.

Cuprins

Cum funcționează învățarea automată nesupravegheată?

În învățarea nesupravegheată, un sistem AI este prezentat cu date neetichetate, necategorizate, iar algoritmii sistemului acționează asupra datelor fără instruire prealabilă. Ieșirea depinde de algoritmii codați. Supunerea unui sistem învățării nesupravegheate este o modalitate stabilită de testare a capacităților acelui sistem.
Algoritmii de învățare nesupravegheat pot efectua sarcini de procesare mai complexe decât sistemele de învățare supravegheată. Cu toate acestea, învățarea nesupravegheată poate fi mai imprevizibilă decât modelul alternativ. Un sistem antrenat folosind modelul nesupravegheat, ar putea, de exemplu, să-și dea seama singur cum să diferențieze pisicile și câinii, ar putea adăuga, de asemenea, categorii neașteptate și nedorite pentru a face față unor rase neobișnuite, care ar putea sfârși prin a aglomera lucrurile în loc să le țină în loc. Ordin.

Pentru algoritmii de învățare nesupravegheați, sistemul AI este prezentat cu un set de date neetichetat și necategorizat. Lucrul de reținut este că acest sistem nu a suferit nicio pregătire anterioară. În esență, învățarea nesupravegheată poate fi considerată ca o învățare fără un profesor.
În cazul învățării supravegheate, sistemul are atât intrările, cât și ieșirile. Deci, în funcție de diferența dintre rezultatul dorit și rezultatul observat, sistemul este setat să învețe și să se îmbunătățească. Cu toate acestea, în cazul învățării nesupravegheate, sistemul are doar intrări și nicio ieșire.
Ce este Machine Learning și de ce contează

Învățarea nesupravegheată este extrem de utilă în timpul sarcinilor asociate cu extragerea datelor și extragerea caracteristicilor. Scopul final al învățării nesupravegheate este de a descoperi tendințe și modele ascunse în date sau de a extrage caracteristicile dorite. După cum am spus mai devreme, învățarea nesupravegheată se ocupă doar de setul de date de intrare fără cunoștințe sau învățare anterioare. Prin urmare, există două tipuri de învățare nesupravegheată:

Învățare parametrică nesupravegheată

Învățarea parametrică nesupravegheată presupune o distribuție parametrică a datelor. Ceea ce înseamnă aceasta este că acest tip de învățare nesupravegheată presupune că datele provin de la o populație care urmează o anumită distribuție a probabilității bazată pe niște parametri. În teorie, dacă luăm în considerare o distribuție normală a unei familii de obiecte, atunci vom vedea că toți membrii au o caracteristică similară și sunt întotdeauna parametrizați prin medie și deviația standard. Aceasta înseamnă că dacă cunoaștem media și abaterea standard și dacă distribuția este normală, atunci putem afla foarte ușor probabilitatea observațiilor viitoare. Învățarea parametrică nesupravegheată este mult mai dificilă decât învățarea supervizată standard, deoarece nu există etichete disponibile; prin urmare, nu există o măsură predefinită de precizie pentru a testa rezultatul.

Învățare neparametrică nesupravegheată

Învățarea neparametrică nesupravegheată se referă la gruparea setului de date de intrare. Fiecare cluster, în esență, spune ceva despre categoriile și clasele elementelor de date prezente în set. Aceasta este metoda cea mai frecvent utilizată pentru modelarea și analiza datelor cu eșantion de dimensiuni mici. Aceste metode sunt denumite și metode fără distribuție deoarece, spre deosebire de cazul învățării parametrice, modelatorul nu trebuie să facă ipoteze despre distribuția întregii populații.
Aceste 6 tehnici de învățare automată îmbunătățesc asistența medicală

În acest moment, este esențial să ne scufundăm puțin în ceea ce înțelegem prin grupare.

Deci, ce este gruparea?

Clusteringul este unul dintre cele mai importante concepte de bază atunci când vine vorba de învățarea nesupravegheată. Se ocupă cu găsirea unei structuri sau a unui model într-o colecție de date necategorizate. O definiție simplă a unui cluster ar putea fi „procesul de grupare a obiectului în clase, astfel încât fiecare membru al unei clase să fie similar cu celălalt într-unul sau altul”.
Prin urmare, un cluster poate fi definit pur și simplu ca o colecție de obiecte de date care sunt „asemănătoare” între un cluster și „disimilare” cu obiectele celuilalt cluster.

Aplicații ale învățării automate nesupravegheate

Scopul învățării automate nesupravegheate este de a descoperi modele și tendințe ascunse anterior în date. Dar, de cele mai multe ori, modelele de date sunt aproximări slabe a ceea ce poate realiza învățarea automată supravegheată – de exemplu, segmentează clienții în grupuri mari, mai degrabă decât să-i trateze ca indivizi și să furnizeze comunicații extrem de personalizate. În cazul învățării nesupravegheate, nu știm care va fi rezultatul și, prin urmare, dacă trebuie să proiectăm un model predictiv, învățarea supravegheată are mai mult sens în contextul real.
Cazul de utilizare ideal pentru utilizarea învățării automate nesupravegheate este atunci când nu aveți date despre rezultatele dorite. De exemplu, dacă trebuie să determinați o piață țintă pentru un produs complet nou. Cu toate acestea, dacă doriți să vă clasificați mai bine baza de consumatori, învățarea supravegheată este cea mai bună opțiune.
5 aplicații revoluționare ale învățării automate

Să ne uităm la câteva aplicații ale tehnicilor de învățare automată nesupravegheată:

Învățarea nesupravegheată este extrem de utilă pentru detectarea anomaliilor din setul dvs. de date. Detectarea anomaliilor se referă la găsirea unor puncte semnificative de date în colecția dvs. de date. Acest lucru este destul de util pentru a afla tranzacții frauduloase, pentru a descoperi bucăți de hardware rupte sau pentru a identifica orice valori aberante care s-ar fi putut strecura în timpul introducerii datelor.
Miningul de asociere înseamnă identificarea unui set de elemente care apar împreună într-un set de date. Aceasta este o tehnică destul de utilă pentru analiza coșului, deoarece le permite analiștilor să descopere bunuri achiziționate adesea împreună. Exploatarea în asociere nu este posibilă fără gruparea datelor, iar când vorbiți despre clustering, vorbiți despre algoritm de învățare automată nesupravegheat.
Un alt caz de utilizare al învățării nesupravegheate este reducerea dimensionalității. se referă la reducerea numărului de caracteristici dintr-un set de date și, prin urmare, la o mai bună preprocesare a datelor. Modelele variabile latente sunt utilizate în mod obișnuit în acest scop și sunt posibile numai prin utilizarea algoritmilor de învățare nesupravegheat.

Tiparele și tendințele descoperite folosind învățarea nesupravegheată pot fi, de asemenea, utile atunci când aplicați algoritmi de învățare supravegheată mai târziu – de exemplu, învățarea nesupravegheată vă poate ajuta să efectuați o analiză de grup pe un set de date și apoi puteți utiliza învățarea supravegheată pe orice grup la alegere/ nevoie.
Ingineri de învățare automată: mituri vs. realități

Per total, învățarea automată și inteligența artificială sunt domenii incredibil de complexe și orice sistem AI sofisticat pe care îl întâlniți va folosi cel mai probabil o combinație de diferiți algoritmi și mecanisme de învățare. Acestea fiind spuse, dacă sunteți începător, este imperativ să cunoașteți punctele cheie care se învârt în jurul tuturor tehnicilor primare de învățare.

Învață cursuri ML de la cele mai bune universități din lume. Câștigă programe de master, Executive PGP sau Advanced Certificate pentru a-ți accelera cariera.
Sperăm că am reușit să clarificăm punctele mai subtile ale unui algoritm de învățare nesupravegheat. Dacă aveți o îndoială, vă rugăm să o lăsați în comentariile de mai jos!

Menționați câteva limitări ale învățării automate nesupravegheate.

În cazul învățării automate nesupravegheate, intervenția umană poate fi necesară pentru a înțelege diversele modele și a le lega cu expertiza în domeniu, ceea ce ar putea fi costisitor. Rezultatele sau constatările sunt adesea considerate inexacte. Sortarea și ieșirea unei sarcini nesupravegheate nu pot fi definite cu precizie. Depinde foarte mult de model și, prin urmare, de mașină. În plus, numărul total de cursuri este necunoscut. Ca urmare, concluziile analizei sunt greu de verificat.

Care este regula de asociere în învățarea automată nesupravegheată?

Regula de asociere este una dintre numeroasele metode de învățare automată nesupravegheată. Puteți crea relații între elementele de date din baze de date uriașe folosind reguli de asociere. Descoperirea unor corelații interesante între variabile în bazele de date masive este scopul acestei abordări/algoritm nesupravegheate. Regula de asociere este un set de abordări care sunt folosite pentru a oferi o bază excelentă pentru generarea de tot felul de predicții și evaluarea șanselor ca anumite apariții să se întâmple peste altele.