Überwachtes vs. unbeaufsichtigtes Lernen: Unterschied zwischen überwachtem und unbeaufsichtigtem Lernen

Veröffentlicht: 2020-11-30

Inhaltsverzeichnis

Einführung

Maschinelles Lernen wird grob in drei Arten eingeteilt, nämlich überwachtes Lernen, unüberwachtes Lernen und verstärkendes Lernen. Reinforcement Learning ist noch neu und befindet sich in rasanter Entwicklung, also lassen Sie uns das in diesem Artikel einfach ignorieren und tief in überwachtes und unüberwachtes Lernen eintauchen.

Bevor wir uns mit den tatsächlichen Definitionen und Verwendungen dieser beiden Arten des Lernens befassen, sollten wir uns zunächst mit maschinellem Lernen vertraut machen. Maschinelles Lernen ist eine Anwendung der künstlichen Intelligenz, die Systemen die Möglichkeit bietet, automatisch aus Erfahrungen zu lernen und sich zu verbessern, ohne explizit programmiert zu werden. Dies ist nur die Lehrbuchdefinition des maschinellen Lernens, da dieser Artikel hauptsächlich für die Neulinge auf dem Gebiet der Datenwissenschaft und der künstlichen Intelligenz geschrieben wurde Lassen Sie mich dies für Sie klarer und interessanter machen, damit Sie es besser verstehen und interpretieren können.

Betrachten wir ein Baby als unsere Maschine, und wir müssen dem Baby helfen, die verschiedenen Zahlen in unserem Zahlensystem zu lernen. Um dem Baby beim Lernen zu helfen, müssen wir dem Baby eine andere Nummer zeigen und sagen, was jede Nummer ist.

Wenn Sie diesen Teil wiederholt ausführen, hilft das Baby, die Zahlen zu lernen und sich zu merken. Dies ist nichts anderes als die Fähigkeit, automatisch aus Erfahrungen zu lernen und sich zu verbessern, ohne explizit programmiert zu werden, dh maschinelles Lernen.

Lesen Sie: Projektideen für maschinelles Lernen

Überwachtes Lernen

Beginnen wir wieder mit der klassischen Lehrbuchdefinition von Supervised Learning und machen uns mit dem Baby-Beispiel vertraut, das wir zuvor genommen haben. Überwachtes Lernen ist die Aufgabe des maschinellen Lernens, eine Funktion zu lernen, die eine Eingabe einer Ausgabe auf der Grundlage von beispielhaften Eingabe-Ausgabe-Paaren zuordnet. Es leitet eine Funktion aus beschrifteten Trainingsdaten ab, die aus einer Reihe von Trainingsbeispielen bestehen.

Ich hasse die Definitionen, die in jedem Lehrbuch geschrieben stehen, da sie so formell zu verstehen sind, lieber würde ich es vorziehen, wenn ein Freund die Definition in seinen eigenen Gedanken erklärt. Wenn ich mich auf Dauer an eine Definition zu erinnern versuche, taucht irgendwann die Erklärung auf, die mir ein Freund anhand eines Beispiels gegeben hat, und macht mir das Leben leichter. Lassen Sie mich in diesem Artikel dieser Freund für Sie sein.

Nehmen wir wieder das Baby-Beispiel, das wir zuvor betrachtet haben. In diesem Fall müssen wir das Baby dazu bringen, die verschiedenen Früchte zu lernen und zu identifizieren, die wir haben. Betrachten wir Apfel und Orange als unsere beiden Früchte und beginnen wir damit, dem Baby diese beiden Bilder zu zeigen. Wir sagen dem Baby auch, welches Bild welche Frucht ist.

Beim Betrachten dieser Bilder erfährt das Baby, dass Früchte rund sind und rote Früchte Apfel und orangefarbene Früchte Orange sind. Lassen Sie uns nun dem Baby ein neues Bild von Orange zeigen und es fragen, ob das Bild Apfel oder Orange ist.

Das Baby sagt voraus, dass die Frucht Orange ist. Das Baby sagt die Frucht richtigerweise als Orange voraus, weil wir die beiden Früchte wie Apfel und Orange in zwei Kategorien eingeteilt haben und das Baby gebeten haben, zu lernen, welche Frucht was ist. So funktioniert Supervised Machine Learning, wenn wir eine Maschine durch ein Baby ersetzen.

Überwachtes maschinelles Lernen wird weiter in zwei Arten von Problemen eingeteilt, die als Klassifizierung und Regression bekannt sind.

Einstufung

Aus dem Namen selbst können wir erkennen, dass es sich um ein Problem des maschinellen Lernens handelt, bei dem wir die gegebenen Daten in zwei oder mehr Klassen klassifizieren müssen. Das obige Beispiel, das wir genommen haben, ist ein Klassifizierungsproblem, da wir die gegebenen Bilder entweder in eine Apple- oder eine Orange-Klasse klassifizieren müssen.

Wenn wir nur zwei Klassen haben, um unsere Daten zu klassifizieren, spricht man von binärer Klassifizierung. Aber in realen Daten neigen wir dazu, mehr als eine Klasse zu haben, und das nennt man Multi-Class-Klassifizierung. Diese Arten des Lernens werden von den meisten verwendet, um Spam-E-Mails zu identifizieren, die Kunden zu klassifizieren, um zu überprüfen, ob ein Kunde vom Betreiber abwandert, und viele weitere Anwendungsfälle.

Lesen Sie auch: Karriere im maschinellen Lernen

Rückfall

Die Regression hingegen befasst sich mit kontinuierlichen Daten, wie z. B. der Vorhersage Ihres Gehalts basierend auf der Erfahrung. In diesem Fall müssen wir die Daten nicht in Klassen einteilen, sondern müssen den kontinuierlichen Wert basierend auf den kontinuierlichen Daten vorhersagen, die wir haben.

Diese Arten von Problemen haben kontinuierliche Spalten in ihrem Datensatz, während die Klassifizierung dazu neigt, kategoriale Spalten zu haben. Diese Arten des Lernens werden verwendet, um das finanzielle Wachstum im nächsten Quartal für jedes Unternehmen, die Noten der Schüler auf der Grundlage ihrer vorherigen Noten und vieles mehr vorherzusagen.

Unbeaufsichtigtes Lernen

Unüberwachtes Lernen ist eine Art maschinelles Lernen, das nach zuvor unentdeckten Mustern in einem Datensatz ohne bereits vorhandene Labels und mit einem Minimum an menschlicher Überwachung sucht.

Im Gegensatz zum überwachten Lernen, das normalerweise von Menschen gekennzeichnete Daten verwendet, ermöglicht das unüberwachte Lernen, auch bekannt als Selbstorganisation, die Modellierung von Wahrscheinlichkeitsdichten über Eingaben. Betrachten wir das Baby-Beispiel, um das unüberwachte maschinelle Lernen besser zu verstehen.

Lassen Sie uns in diesem Beispiel eine Gruppe von Katzen- und Hundebildern als Eingabe verwenden, in früheren Beispielen weiß das Baby, dass die Bilder von Apple und Orange sind, da wir sie beschriftet und kategorisiert haben.

In diesem Fall weiß das Baby nichts und kann daher nicht einordnen, welches eine Katze und welches ein Hund ist. Aber ich kann sagen, dass nur wenige der Bilder im Vergleich zu den anderen ähnlich aussehen. In diesem Fall können wir die Daten nicht kennzeichnen, aber wir können immer noch Muster in den Daten finden. So funktioniert das Unsupervised Machine Learning.

Clustering

Das obige Beispiel beschreibt deutlich das Clustering-Problem, wir müssen unseren Datensatz basierend auf den Mustern, die wir in unseren Daten finden, clustern. Clustering ist ein sehr wichtiges Problem des maschinellen Lernens, und viele Unternehmen neigen dazu, diese Technik zu verwenden, um wertvolle Muster und Erkenntnisse aus ihren Daten zu finden.

Fazit

In diesem Artikel haben wir die verschiedenen Arten des maschinellen Lernens kennengelernt, diese anhand eines leicht verständlichen Beispiels verstanden und die weiteren Unterteilungen jedes Lernens untersucht. Dieser Artikel behandelt nur die Grundlagen der Probleme des maschinellen Lernens, jede Art von Problem hat unterschiedliche Arten von maschinellen Lernalgorithmen.

Wenn Sie mehr über maschinelles Lernen erfahren möchten, sehen Sie sich das PG-Diplom in maschinellem Lernen und KI von IIIT-B & upGrad an, das für Berufstätige konzipiert ist und mehr als 450 Stunden strenge Schulungen, mehr als 30 Fallstudien und Aufgaben bietet, IIIT- B-Alumni-Status, mehr als 5 praktische, praktische Abschlussprojekte und Jobunterstützung bei Top-Unternehmen.

Führen Sie die KI-gesteuerte technologische Revolution an

PG DIPLOM IN MASCHINELLEM LERNEN UND KÜNSTLICHER INTELLIGENZ
Erfahren Sie mehr