Wie funktioniert maschinelles Lernen – eine einfache Anleitung
Veröffentlicht: 2019-07-31Netflix und Amazon sind in ihrem Spiel ziemlich gut geworden – sie scheinen immer zu wissen, welche Inhalte oder Produkte Sie gerne sehen / kaufen würden. Lieben Sie es nicht, alles bereits nach Ihrem Geschmack und Ihren Vorlieben kuratiert zu sehen?
Während die meisten von uns die geheime Zutat hinter der raffinierten Recommendation Engine von Netflix und Amazon kennen (natürlich maschinelles Lernen!), Wie viele von uns sind mit den inneren Mechanismen des maschinellen Lernens vertraut?
Um es klar zu stellen – Wie funktioniert maschinelles Lernen ?
Im Wesentlichen ist maschinelles Lernen eine Datenanalysetechnik (eine Teilmenge der KI), die darauf abzielt, aus Erfahrungen zu „lernen“ und es Maschinen zu ermöglichen, Aufgaben auszuführen, die Intelligenz erfordern. Algorithmen des maschinellen Lernens wenden Rechenverfahren an, um Informationen zu extrahieren und direkt aus Daten zu lernen, ohne explizit dafür programmiert zu sein (nicht von einer vorgegebenen Gleichung abhängig zu sein).
Die Anatomie maschineller Lernsysteme
Alle ML-Systeme können in drei Teile zerlegt werden:

- Modell – die Komponente, die sich mit den Identifikationen befasst, dh Vorhersagen.
- Parameter – bezieht sich auf die Faktoren, die vom Modell verwendet werden, um seine Entscheidungen (Vorhersagen) zu treffen.
- Lernender – die Komponente, die die Parameter (und insgesamt das Modell) anpasst, indem sie die Unterschiede in den Vorhersagen im Vergleich zum tatsächlichen Ergebnis berücksichtigt.
Arten des maschinellen Lernens
Nachdem Sie nun mit den Kernkomponenten von ML-Systemen vertraut sind, ist es an der Zeit, einen Blick auf die verschiedenen Arten des „Lernens“ zu werfen.
Überwachtes Lernen
Beim überwachten Lernen wird ein Modell explizit darauf trainiert, wie die Eingabe auf die Ausgabe abgebildet werden kann. Ein überwachter Lernalgorithmus nimmt einen erkannten Satz von Eingabedaten zusammen mit bekannten Antworten (Ausgabe) auf diese Daten und trainiert das Modell, um vernünftige Vorhersagen als Reaktion auf neue Eingabedaten zu generieren.
Überwachtes Lernen verwendet zwei Ansätze zur Entwicklung von Vorhersagemodellen –
- Klassifizierung – Wie der Name schon sagt, klassifiziert diese Technik Eingabedaten in verschiedene Kategorien, indem sie gekennzeichnet werden. Es wird verwendet, um diskrete Reaktionen vorherzusagen (z. B. ob eine Krebszelle gutartig oder bösartig ist). Medizinische Bildgebung, Spracherkennung und Kreditbewertung sind drei beliebte Anwendungsfälle für die Klassifizierung.
- Regression – Diese Technik wird verwendet, um kontinuierliche Antworten vorherzusagen, indem die Muster in den Eingabedaten identifiziert werden. Zum Beispiel Temperatur- oder Wetterschwankungen. Die Regression wird verwendet, um das Wetter, die Stromlast und den algorithmischen Handel vorherzusagen.
Unbeaufsichtigtes Lernen
Der Ansatz des unüberwachten Lernens verwendet unbeschriftete Daten und versucht, die darin verborgenen Muster aufzudecken. Somit zieht die Technik Rückschlüsse aus Datensätzen, die aus Eingabedaten ohne gekennzeichnete Antworten bestehen.
- Clustering – Clustering ist eine der gebräuchlichsten Methoden des unbeaufsichtigten Lernens und eine explorative Datenanalysetechnik, die Daten ohne bekannte Informationen über die Cluster-Anmeldeinformationen in „Cluster“ kategorisiert. Objekterkennung und Gensequenzanalyse sind zwei Beispiele für Clustering.
- Dimensionality Reduction – Dimensionality Reduction bereinigt die Eingabedaten von allen redundanten Informationen und behält nur die wesentlichen Teile bei. So werden die Daten nicht nur sauber, sondern auch kleiner und nehmen dadurch weniger Speicherplatz ein.
Verstärkungslernen
Reinforcement Learning zielt darauf ab, selbsttragende und selbstlernende Modelle aufzubauen, die durch Versuch und Irrtum lernen und sich verbessern können. Wenn der Algorithmus im Lernprozess (Training) bestimmte Aktionen erfolgreich ausführen kann, werden Belohnungssignale ausgelöst. Die Belohnungssignale fungieren wie Leitplanken für die Algorithmen. Es gibt zwei Belohnungssignale:

- Ein positives Signal wird ausgelöst, um eine bestimmte Aktionsfolge zu fördern und fortzusetzen.
- Ein negatives Signal ist eine Strafe für eine bestimmte falsche Handlung. Es verlangt die Korrektur von Fehlern, bevor es im Trainingsprozess weitergeht.
Reinforcement Learning ist in Videospielen weit verbreitet. Es ist auch der Mechanismus hinter selbstfahrenden Autos.
Innerhalb der „Lernfunktion“ von ML-Algorithmen
Hinter der Funktionsweise von ML-Algorithmen und ihrem Lernen durch Erfahrung stehen drei gemeinsame Prinzipien.
Lernen einer Funktion
Im ersten Schritt des Lernprozesses lernen ML-Algorithmen die Zielfunktion (f) kennen, die die Eingangsvariable (X) am besten auf die Ausgangsvariable (Y) abbildet. Damit,
Y = f(X).
Hier ist die Form der Zielfunktion (f) unbekannt, daher die prädiktive Modellierung.
In dieser allgemeinen Lernphase lernt der ML-Algorithmus, basierend auf den neuen Eingabevariablen (X) zukünftige Vorhersagen (Y) zu treffen. Natürlich ist der Prozess nicht fehlerfrei. Hier existiert der Fehler (e) unabhängig von den Eingangsdaten (X). Damit,
Y = f(X) + e
Da der Fehler (e) möglicherweise nicht genügend Attribute hat, um das Abbildungsszenario von X nach Y am besten zu charakterisieren, wird er als irreduzibler Fehler bezeichnet – unabhängig davon, wie gut der Algorithmus beim Schätzen der Zielfunktion (f) wird, können Sie den Fehler nicht reduzieren ( e).
Vorhersagen treffen und lernen, wie man sie verbessert
Im vorherigen Punkt haben wir verstanden, wie ein ML-Algorithmus eine Zielfunktion lernt (f). Und wir wissen bereits, dass unser einziges Ziel hier darin besteht, den bestmöglichen Weg zu finden, um Y von X abzubilden. Mit anderen Worten, wir müssen den genauesten Weg finden, um die Eingabe auf die Ausgabe abzubilden.
Es wird Fehler geben (e), ja, aber der Algorithmus muss immer wieder versuchen zu verstehen, wie weit er von der gewünschten Ausgabe (Y) entfernt ist und wie er sie erreicht. Dabei passt es die Parameter bzw. die Eingangswerte (X) kontinuierlich an die Ausgangswerte (Y) an. Dies wird fortgesetzt, bis es mit dem gewünschten Ausgabemodell einen hohen Grad an Ähnlichkeit und Genauigkeit erreicht.
So lernen Sie maschinelles Lernen – Schritt für SchrittDer Lernansatz „Gradientenabstieg“.
Es mag stimmen, dass wir bei der Entwicklung „intelligenter“ Maschinen erfolgreich waren, aber ihr Lerntempo ist unterschiedlich – Maschinen neigen dazu, es langsam anzugehen. Sie glauben an den Lernprozess des „gradienten Abstiegs“ – Sie springen nicht sofort, sondern machen kleine Schritte und steigen langsam von der Spitze ab (die Metapher hier ist die des Absteigens eines Berges).

Beim Abstieg von einem Berg springt oder rennt oder schleudert man sich nicht in einem Rutsch hinunter; Stattdessen unternehmen Sie gemessene und kalkulierte Schritte, um sicher auf den Grund zu gelangen und Pannen zu vermeiden.
ML-Algorithmen verwenden diesen Ansatz – sie passen sich ständig an die sich ändernden Parameter an (stellen Sie sich noch einmal das raue und unerforschte Gelände eines Berges vor), um schließlich das gewünschte Ergebnis zu erzielen.
Schlussfolgern…
Das grundlegende Ziel aller Algorithmen für maschinelles Lernen ist die Entwicklung eines Vorhersagemodells, das sich am besten auf bestimmte Eingabedaten verallgemeinern lässt. Da sich ML-Algorithmen und -Systeme durch verschiedene Arten von Eingaben/Variablen/Parametern selbst trainieren, ist es unerlässlich, über einen riesigen Datenpool zu verfügen. Dies soll es den ML-Algorithmen ermöglichen, mit verschiedenen Arten von Daten zu interagieren, um ihr Verhalten zu lernen und die gewünschten Ergebnisse zu erzielen.
Wir hoffen, dass wir mit diesem Beitrag die Funktionsweise des maschinellen Lernens für Sie entmystifizieren konnten!