Markov-Ketten-Konzept erklärt [mit Beispiel]

Veröffentlicht: 2020-12-18

Inhaltsverzeichnis

Einführung

Markov-Ketten sind weit verbreitet, intuitiv und wurden in mehreren Bereichen wie der Automatisierung der Inhaltserstellung, der Textgenerierung, der Finanzmodellierung, Tempomatsystemen usw. verwendet. Die berühmte Marke Google verwendet die Markov-Kette in ihrem Seitenranking-Algorithmus, um die Suchreihenfolge zu bestimmen .

Markov-Ketten sind relativ einfach und erfordern kein mathematisches Konzept oder fortgeschrittene Statistikkenntnisse für die Implementierung. Wenn Sie ein gutes Verständnis von Markov-Ketten haben, wird es einfacher, probabilistische Modellierung und datenwissenschaftliche Techniken zu erlernen.

Dieser Artikel vermittelt Ihnen anhand von Beispielen ein tiefes Verständnis dafür, was Markov-Ketten sind und wie sie funktionieren.

Was ist eine Markov-Kette?

Eine Markov-Kette ist ein mathematisches Modell, das Wahrscheinlichkeiten oder Vorhersagen für den nächsten Zustand basierend ausschließlich auf dem vorherigen Ereigniszustand liefert. Die Vorhersagen, die von der Markov-Kette generiert werden, sind so gut, wie sie gemacht würden, wenn man die gesamte Geschichte dieses Szenarios beobachtet.

Es ist ein Modell, das einen Übergang von einem Zustand in den anderen Zustand basierend auf einigen Wahrscheinlichkeitsbedingungen erfährt. Ein Merkmal, das die Markov-Kette definiert, besteht darin, dass die zukünftigen Zustände festgelegt sind, unabhängig davon, wie der aktuelle Zustand erreicht wird. Das mögliche Ergebnis des nächsten Zustands hängt ausschließlich vom aktuellen Zustand und der Zeit zwischen den Zuständen ab.

Lesen Sie: Markov-Kette im Python-Tutorial

Markov-Kettenkonzept mit Beispielen

Angenommen, Sie möchten die Wetterbedingungen für morgen vorhersagen. Aber Sie wissen bereits, dass es nur zwei mögliche Zustände für das Wetter geben kann, nämlich bewölkt und sonnig. Wie werden Sie das Wetter des nächsten Tages mit Markov-Ketten vorhersagen?

Nun, Sie werden anfangen, den aktuellen Wetterzustand zu beobachten, und es könnte entweder sonnig oder bewölkt sein. Angenommen, es ist heute sonnig. Der Klimazustand durchläuft immer mehrere Übergänge. Sie sammeln Wetterdaten der letzten Jahre und berechnen, dass die Wahrscheinlichkeit, nach einem sonnigen Tag einen bewölkten Tag zu bekommen, 0,35 beträgt.

Sie haben auch beobachtet, dass die Wahrscheinlichkeit, einen sonnigen Tag nach einem sonnigen Tag zu bekommen, 0,65 beträgt. Diese Verteilung hilft Ihnen bei der Vorhersage, dass der nächste Tag ebenfalls sonnig sein wird. Auf diese Weise hilft Ihnen der aktuelle Wetterzustand bei der Vorhersage des zukünftigen Zustands, und Sie können die gleiche Logik anwenden, um die Wetterbedingungen für die kommenden Tage vorherzusagen.

Das obige Beispiel veranschaulicht Markovs Eigenschaft, dass die Markov-Kette gedächtnislos ist. Die Wetterbedingungen des nächsten Tages sind nicht von den Schritten abhängig, die zu den Wetterbedingungen des aktuellen Tages geführt haben. Die Wahrscheinlichkeitsverteilung wird nur durch Erleben des Übergangs vom aktuellen Tag zum nächsten Tag erreicht.

Ein weiteres Beispiel für die Markov-Kette sind die Essgewohnheiten einer Person, die nur Obst, Gemüse oder Fleisch isst. Die Essgewohnheiten unterliegen folgenden Regeln:

  • Die Person isst nur einmal am Tag.
  • Wenn jemand heute Obst gegessen hat, wird er morgen mit gleicher Wahrscheinlichkeit Gemüse oder Fleisch essen.
  • Wenn er heute Gemüse gegessen hat, wird er morgen mit einer Wahrscheinlichkeit von 1/10 Gemüse, mit einer Wahrscheinlichkeit von 1/40 Obst und mit einer Wahrscheinlichkeit von 1/50 Fleisch essen.
  • Wenn er heute Fleisch gegessen hat, wird er morgen mit einer Wahrscheinlichkeit von 4/10 Gemüse essen, mit einer Wahrscheinlichkeit von 6/10 Obst. Er wird morgen kein Fleisch mehr essen.

Sie können seine Essgewohnheiten leicht mit Markov-Ketten modellieren, da seine Wahl für den nächsten Tag ausschließlich davon abhängt, was er heute gegessen hat, unabhängig davon, was er gestern oder vorgestern gegessen hat.

Lesen Sie auch: Einführung in Markov-Ketten

Markov-Ketten-Übergangsmatrix

Bisher haben wir gesehen, wie wir die Wahrscheinlichkeit des Übergangs von einem Zustand in einen anderen vorhersagen können. Aber wie wäre es mit der Ermittlung der Wahrscheinlichkeitsverteilung von Übergängen, die über mehrere Schritte hinweg auftreten? Sie können die Wahrscheinlichkeitsverteilung von Übergängen über mehrere Schritte mithilfe der Markov-Ketten-Übergangsmatrix ermitteln.

Die Übergangsmatrix der Markov-Kette ist nichts anderes als die Wahrscheinlichkeitsverteilung von Übergängen von einem Zustand in einen anderen. Sie wird Übergangsmatrix genannt, weil sie die Übergänge zwischen verschiedenen möglichen Zuständen anzeigt.

Die jedem Zustand zugeordnete Wahrscheinlichkeit wird die Wahrscheinlichkeitsverteilung dieses Zustands genannt. Es ist das wichtigste Werkzeug, das bei der Analyse der Markov-Kette verwendet wird. Wenn es zum Beispiel N mögliche Zustände gibt, dann wäre die Übergangsmatrix (P) wie folgt

P = N x N-Matrix

Wobei ein Eintrag in einer Zeile (I, J) die Wahrscheinlichkeit des Übergangs vom Zustand I zum Zustand J darstellt. Jede Zeile der Übergangsmatrix P sollte sich zu 1 summieren.

Um eine Markov-Kette darzustellen, benötigen Sie außerdem einen Anfangszustandsvektor, der den Start bei jedem der N möglichen Zustände beschreibt. Sie können den Anfangszustandsvektor (X) darstellen als

X = N x 1-Matrix

Angenommen, Sie möchten die Wahrscheinlichkeit für den Übergang vom Zustand I zum Zustand J über M mehrere Schritte ermitteln. Sie haben drei mögliche Zustände angegeben, dh Bullenmarkt, Bärenmarkt und stagnierender Markt.

Im obigen Beispiel zeigt die erste Spalte der Übergangsmatrix den Bullenmarkt, die zweite den Bärenmarkt und die dritte den stagnierenden Markt an. Die Zeilen korrespondieren auch in ähnlicher Weise.

In der Übergangsmatrix wird die Übergangswahrscheinlichkeit berechnet, indem P mit der Anzahl der Schritte (M) potenziert wird. Für einen 3-Stufen-Übergang können Sie die Wahrscheinlichkeit bestimmen, indem Sie P auf 3 erhöhen.

Durch Multiplizieren der obigen P3-Matrix können Sie die Wahrscheinlichkeitsverteilung für den Übergang von einem Zustand in einen anderen berechnen.

Fazit

Da Sie verstanden haben, wie die Markov-Kette funktioniert, können Sie sie leicht in jede Problemstellung implementieren, um entweder eine Lösung zu finden oder zu automatisieren. Markov-Ketten sind sehr leistungsfähig und bilden eine Grundlage für andere fortgeschrittenere Modellierungstechniken.

Das Verständnis der Markov-Kette kann Sie dazu bringen, tieferes Wissen in verschiedenen Techniken wie Kurzmodellierung und Abtastung zu erlangen.

Wenn Sie neugierig sind, mehr über Python und Data Science zu erfahren, schauen Sie sich das PG Diploma in Data Science von IIIT-B & upGrad an, das für Berufstätige entwickelt wurde und mehr als 10 Fallstudien und Projekte, praktische praktische Workshops, Mentoring mit Branchenexperten, 1-on-1 mit Mentoren aus der Branche, mehr als 400 Stunden Lern- und Jobunterstützung bei Top-Unternehmen.

Gibt es interessante praktische Anwendungsfälle für die Markov-Kette?

Ja, es gibt viele interessante reale Anwendungsfälle von Markov-Ketten, von der Texterstellung bis zur Finanzmodellierung. Die meisten Textgeneratoren verwenden die Markov-Netzwerke. Das Kettensystem wird häufig verwendet, um gefälschte Texte, übergroße Artikel und Reden zu erstellen. Die Namensgeneratoren, die wir normalerweise im Internet sehen, verwenden ebenfalls die Markov-Kette. Eine weitere bekannte Anwendung von Markov-Ketten ist die Vorhersage kommender Wörter. Sie sind auch hilfreich für die automatische Vervollständigung und Empfehlungen. Der Google PageRank und der Subreddit-Simulator sind prominente Beispiele, die Markov-Ketten verwenden, um die Produktion von Material für einen ganzen Subreddit zu automatisieren.

Ist die Markov-Kette beim Erlernen von Data Science entscheidend?

Obwohl Markov-Ketten für Data-Science-Lernende nicht obligatorisch sind, können sie einen hervorragenden Ansatz zum Erlernen probabilistischer Modellierung und Data-Science-Techniken bieten. Markov-Ketten sind theoretisch relativ einfach und können ohne komplexe statistische oder mathematische Ideen implementiert werden. Die prominenteste Anwendung der Datenwissenschaft sind Vorhersagen, und Datenwissenschaftler verwenden die bedingte Wahrscheinlichkeit von Markov-Ketten, um diese Vorhersagen zu treffen. Es ist nach dem gedächtnislosen Merkmal stochastischer Prozesse benannt, das besagt, dass die Verteilung zukünftiger Zustände eines jeden Prozesses nur durch den aktuellen Zustand dieser Prozesse bestimmt wird.

Wie hilft die Markov-Kette im PageRank-Algorithmus von Google?

Der PageRank-Algorithmus von Google ist ein bekannter Link-basierter Ranking-Algorithmus. Anstatt die Seiten anhand ihres Inhalts zu bewerten, ordnet Page Rank sie anhand ihrer miteinander verbundenen Struktur. Durch einfaches Untersuchen des gegenwärtigen Zustands kann die Markov-Kette dabei helfen, das Verhalten eines Systems beim Übergang von einem Zustand in einen anderen vorherzusehen.

Wenn ein Benutzer eine Suchanfrage in eine Suchmaschine eingibt, identifiziert der PageRank-Algorithmus Websites im Web, die mit dem Suchwort übereinstimmen, und zeigt dem Benutzer diese Seiten in der Reihenfolge ihres PageRanks mithilfe des Markov-Netzwerks an. Der PageRank-Algorithmus bestimmt die Bedeutung einer Website ausschließlich anhand der Linkstruktur des Webs und nicht anhand des Seiteninhalts.