Wprowadzenie do łańcuchów Markowa: wymagania wstępne, właściwości i zastosowania

Opublikowany: 2020-04-14

Czy kiedykolwiek przyszło Ci do głowy, jak eksperci meteorolodzy dokonują precyzyjnej prognozy pogody lub jak Google klasyfikuje różne strony internetowe? Jak tworzą fascynujące aplikacje Pythona w prawdziwym świecie. Obliczenia te są złożone i obejmują kilka zmiennych, które są dynamiczne i można je rozwiązać za pomocą oszacowań prawdopodobieństwa.

Kiedy Google wprowadził swój algorytm PageRank, zrewolucjonizował branżę internetową. A jeśli znasz ten algorytm, musisz również wiedzieć, że używa on łańcuchów Markowa. W naszym wprowadzeniu do łańcuchów Markowa przyjrzymy się im krótko i zrozumiemy, czym one są. Więc zacznijmy.

Spis treści

Warunki wstępne

Niezbędne jest poznanie kilku pojęć, zanim zaczniemy omawiać łańcuchy Markowa. A większość z nich pochodzi z teorii prawdopodobieństwa. Niematematycznie możesz zdefiniować wartość zmiennej losowej jako wynik zdarzenia losowego. Na przykład, gdyby zmienna była wynikiem rzucenia kostką, byłaby to liczba, podczas gdy gdyby była wynikiem rzutu monetą, byłaby to wartość logiczna (0 lub 1). Zbiór tych możliwych wyników może być zarówno ciągły, jak i dyskretny.

Możemy więc powiedzieć, że proces stochastyczny to zbiór zmiennych losowych, które ustalają indeksy. Ten zestaw reprezentuje różne instancje czasowe. Ten zbiór może składać się z liczb rzeczywistych (proces ciągły) lub liczb naturalnych (proces dyskretny).

Przeczytaj: Wbudowane struktury danych w Pythonie

Wprowadzenie do łańcuchów Markowa

Łańcuchy Markowa wzięły swoją nazwę od Andreya Markowa, który po raz pierwszy przedstawił tę koncepcję w 1906 roku. Łańcuchy Markowa odnoszą się do procesów stochastycznych, które zawierają zmienne losowe, a zmienne te przechodzą ze stanu do stanu zgodnie z regułami prawdopodobieństwa i założeniami.

Pytasz, jakie są te probabilistyczne zasady i założenia? Są to tak zwane właściwości Markowa. Dowiedz się więcej o Łańcuch Markowa w samouczku Pythona

Czym jest Posiadłość Markowa?

Istnieje wiele grup procesów losowych, takich jak modele autoregresyjne i procesy Gaussa. Własność Markowa ułatwia badanie tych procesów losowych. Własność Markowa oznacza, że ​​nie uzyskalibyśmy więcej informacji o przyszłych wynikach procesu, zwiększając naszą wiedzę o jego przeszłości, gdybyśmy znali jego wartość w określonym czasie.

Bardziej rozbudowana definicja brzmiałaby: Własność Markowa mówi, że prawdopodobieństwo procesu stochastycznego zależy tylko od jego aktualnego stanu i czasu i jest niezależne od innych stanów, jakie miał wcześniej. Dlatego jest to właściwość bez pamięci, ponieważ zależy tylko od aktualnego stanu procesu.

Jednorodny dyskretny łańcuch Markowa to proces Marko, który ma dyskretną przestrzeń stanów i czas. Można powiedzieć, że łańcuch Markowa jest dyskretną serią stanów i posiada własność Markowa.

Oto matematyczna reprezentacja łańcucha Markowa:

X = ( X n ) n N = ( X 0 , X 1 , X 2 , …)

Właściwości łańcuchów Markowa

Przyjrzyjmy się podstawowym cechom łańcuchów Markowa, aby lepiej je zrozumieć. Nie będziemy się zagłębiać w ten temat, ponieważ celem tego artykułu jest zapoznanie Cię z ogólną koncepcją łańcuchów Markowa.

Redukowalność

Łańcuchy Markowa są nieredukowalne. Oznacza to, że nie mają redukowalności, jeśli mogą osiągnąć dowolny stan z innego stanu. Łańcuch nie musi przechodzić z jednego stanu do drugiego w zaledwie jednym kroku czasowym; może to zrobić w wielu krokach czasowych. Gdybyśmy mogli przedstawić łańcuch za pomocą wykresu, wówczas wykres byłby mocno połączony.

Aperiodyczny

Powiedzmy, że okres stanu wynosi k. Jeśli k = 1, to stan ten jest nieokresowy, gdy jakikolwiek powrót do tego stanu wymaga pewnej wielokrotności k kroków czasowych. Gdy wszystkie stany łańcucha Markowa są aperiodyczne, to możemy powiedzieć, że łańcuch Markowa jest aperiodyczny.

Stany przejściowe i nawracające

Kiedy opuszczasz stan i istnieje prawdopodobieństwo, że nie możesz do niego wrócić, mówimy, że stan jest przejściowy. Z drugiej strony, jeśli możemy powrócić do stanu z prawdopodobieństwem 1, po jego opuszczeniu, możemy powiedzieć, że właściwość jest powtarzalna.

Możemy mieć dwa rodzaje stanów nawracających. Pierwszy z nich to dodatni stan rekurencyjny, który ma skończony oczekiwany czas powrotu, a drugi to pusty stan rekurencyjny, który ma nieskończony oczekiwany czas powrotu. Oczekiwany czas powrotu odnosi się do średniego czasu nawrotu, kiedy opuszczamy stan.

Zastosowania łańcuchów Markowa

Łańcuchy Markowa znajdują zastosowanie w wielu obszarach. Oto ich wybitne zastosowania:

  • Algorytm Google PageRank traktuje sieć jak model Markowa. Można powiedzieć, że wszystkie strony internetowe są stanami, a łącza między nimi to przejścia o określonych prawdopodobieństwach. Innymi słowy, możemy powiedzieć, że bez względu na to, czego szukasz w Google, istnieje ograniczone prawdopodobieństwo, że trafisz na określoną stronę internetową.
  • Jeśli korzystasz z Gmaila, na pewno zauważyłeś ich funkcję autouzupełniania. Ta funkcja automatycznie przewiduje Twoje zdania, aby pomóc Ci szybko pisać e-maile. Łańcuchy Markowa bardzo pomagają w tym sektorze, ponieważ mogą skutecznie dostarczać tego rodzaju prognozy.
  • Czy słyszałeś o Reddicie? Jest to znacząca platforma mediów społecznościowych wypełniona subredditami (nazwa społeczności w Reddit) o ​​określonych tematach. Reddit wykorzystuje łańcuchy i modele Markowa do symulacji subredditów, aby lepiej zrozumieć to samo.

Dowiedz się więcej: Ewolucja modelowania języka we współczesnym życiu

Końcowe przemyślenia

Wygląda na to, że dotarliśmy do końca naszego wprowadzenia do łańcuchów Markowa. Mamy nadzieję, że ten artykuł okazał się przydatny. Jeśli masz jakieś pytania lub wątpliwości, podziel się nimi z nami w komentarzach. Chcielibyśmy usłyszeć od ciebie.

Jeśli chcesz dowiedzieć się więcej na ten temat, powinieneś udać się do naszej sekcji kursów. Znajdziesz tam mnóstwo cennych surowców.

Jeśli jesteś zainteresowany nauką o danych, sprawdź IIIT-B i upGrad's PG Diploma in Data Science, który jest stworzony dla pracujących profesjonalistów i oferuje ponad 10 studiów przypadków i projektów, praktyczne warsztaty praktyczne, mentoring z ekspertami z branży, 1- on-1 z mentorami branżowymi, ponad 400 godzin nauki i pomocy w pracy z najlepszymi firmami.

Czy istnieje jakieś rzeczywiste zastosowanie łańcuchów Markowa?

Jednym z najważniejszych testów do radzenia sobie z odrębnymi procedurami próbnymi jest łańcuch Markowa. W finansach i ekonomii łańcuchy Markowa są używane do reprezentowania różnych wydarzeń, takich jak krach na rynku i wartości aktywów. Łańcuchy Markowa są stosowane w wielu dziedzinach akademickich, w tym w biologii, ekonomii, a nawet w rzeczywistych scenariuszach. Parkingi mają określoną liczbę dostępnych miejsc, ale ile jest dostępnych w danym momencie, można scharakteryzować za pomocą modelu Markowa opartego na kombinacji wielu czynników lub zmiennych. Łańcuchy Markowa są często używane do tworzenia fałszywych tekstów, długich artykułów i przemówień.

Co oznacza termin równowaga w odniesieniu do łańcuchów Markowa?

Mówimy, że rozkład πT jest rozkładem równowagi Jeśli πT P = πT. Równowaga odnosi się do sytuacji, w której rozkład Xt nie zmienia się w miarę postępów w łańcuchu Markowa. W rzeczywistości wyróżniającą cechą łańcucha Markowa jest to, że potencjalne przyszłe stany są stałe, niezależnie od tego, w jaki sposób proces osiągnął swój obecny stan. Innymi słowy, prawdopodobieństwo przejścia do dowolnego stanu jest całkowicie określone przez obecny stan i czas, który upłynął.

Czy czas Markov Chains jest jednorodny?

Jeżeli prawdopodobieństwo przejścia między dwiema podanymi wartościami stanu w dowolnych dwóch momentach zależy tylko od różnicy między tymi czasami, proces jest jednorodny w czasie. Istnieją warunki, aby łańcuch Markowa był jednorodny lub niejednorodny. Mówi się, że prawdopodobieństwa przejścia łańcucha Markowa są jednorodne wtedy i tylko wtedy, gdy są niezależne od czasu. Własność Markowa jest zachowywana w niejednorodnych łańcuchach Markowa (nhmc), chociaż prawdopodobieństwa przejścia mogą się zmieniać w czasie. W tej sekcji przedstawiono kryteria, które gwarantują obecność granicy zmienności w takich łańcuchach w celu zastosowania ich do symulowanego wyżarzania.