馬爾可夫鏈簡介:先決條件、屬性和應用
已發表: 2020-04-14你有沒有想過專家氣象學家如何準確預測天氣或谷歌如何對不同的網頁進行排名? 他們如何在現實世界中製作迷人的 Python 應用程序。 這些計算很複雜,涉及多個動態變量,可以使用概率估計來解決。
當 Google 推出其 PageRank 算法時,它徹底改變了網絡行業。 如果您熟悉該算法,您還必須知道它使用馬爾可夫鏈。 在我們對馬爾可夫鏈的介紹中,我們將簡要介紹它們並了解它們是什麼。 那麼,讓我們開始吧。
目錄
先決條件
在我們開始討論馬爾可夫鏈之前,了解一些概念是必不可少的。 其中大部分來自概率論。 非數學上,您可以將隨機變量的值定義為隨機事件的結果。 因此,例如,如果變量是擲骰子的結果,那麼它將是一個數字,而如果它是擲硬幣的結果,那麼它將是一個布爾值(0 或 1)。 這些可能結果的集合可以是連續的也可以是離散的。
所以我們可以說隨機過程是一組設置索引的隨機變量。 該集合代表不同的時間實例。 該集合可以是實數(連續過程)或自然數(離散過程)。
閱讀: Python 中的內置數據結構
馬爾可夫鏈簡介
馬爾可夫鏈得名於安德烈馬爾可夫,他在 1906 年首次提出了這個概念。馬爾可夫鍊是指包含隨機變量的隨機過程,這些變量根據概率規則和假設從一個狀態轉換到另一個狀態。
你問這些概率規則和假設是什麼? 這些被稱為馬爾可夫屬性。 學習更多關於 Python教程中的馬爾可夫鏈
什麼是馬爾可夫屬性?
有很多組隨機過程,例如自回歸模型和高斯過程。 馬爾可夫性質使研究這些隨機過程變得相當容易。 馬爾可夫屬性指出,如果我們知道某個過程在特定時間的價值,我們將不會通過增加我們對其過去的了解來獲得有關該過程未來結果的更多信息。
更詳細的定義是:馬爾可夫屬性表示隨機過程的概率僅取決於其當前狀態和時間,並且與之前的其他狀態無關。 這就是為什麼它是一個無記憶的屬性,因為它只取決於進程的當前狀態。
齊次離散時間馬爾可夫鍊是具有離散狀態空間和時間的馬爾可過程。 可以說,馬爾可夫鍊是一系列離散的狀態,具有馬爾可夫性質。
這是馬爾可夫鏈的數學表示:
X = ( X n ) n N =( X 0 , X 1 , X 2 , ...)
馬爾可夫鏈的性質
讓我們看一下馬爾可夫鏈的基本特徵,以更好地理解它們。 我們不會深入探討這個主題,因為本文的目的是讓您熟悉馬爾可夫鏈的一般概念。

可還原性
馬爾可夫鍊是不可約的。 這意味著如果它可以從另一個狀態到達任何狀態,它們就沒有可還原性。 鏈不需要在一個時間步內從另一個狀態到達一個狀態; 它可以在多個時間步驟中這樣做。 如果我們可以用圖來表示鏈,那麼圖將是牢固連接的。
非週期性
假設一個狀態的周期是 k。 如果 k = 1,則當任何類型的返回其狀態需要 k 個時間步的倍數時,此狀態是非週期性的。 當馬爾可夫鏈的所有狀態都是非週期性的,那麼我們可以說馬爾可夫鍊是非週期性的。
瞬態和循環狀態
當你離開一個狀態,並且有可能無法回到它時,我們說這個狀態是短暫的。 另一方面,如果我們能夠以概率 1 回到一個狀態,在我們離開它之後,我們可以說這個屬性是循環的。
我們可以有兩種循環狀態。 第一個是具有有限預期返回時間的正循環狀態,第二個是具有無限預期返回時間的空循環狀態。 預期返回時間是指我們離開該州時的平均復發時間。
馬爾可夫鏈的應用
馬爾可夫鏈在許多領域都有應用。 以下是它們的突出應用:
- Google 的 PageRank 算法將網絡視為馬爾可夫模型。 可以說所有的網頁都是狀態,它們之間的鏈接是具有特定概率的轉換。 換句話說,我們可以說,無論您在 Google 上搜索什麼,您最終訪問特定網頁的可能性都是有限的。
- 如果您使用 Gmail,您一定注意到了他們的自動填充功能。 此功能會自動預測您的句子,以幫助您快速撰寫電子郵件。 馬爾可夫鏈在這個領域有很大幫助,因為它們可以有效地提供這種預測。
- 你聽說過Reddit嗎? 這是一個重要的社交媒體平台,裡面充斥著特定主題的子版塊(Reddit 中社區的名稱)。 Reddit 使用馬爾可夫鍊和模型來模擬 subreddit,以便更好地理解它們。
了解更多:現代生活中語言建模的演變
最後的想法
看來我們已經到了對馬爾可夫鏈的介紹的結尾。 我們希望您發現這篇文章很有用。 如果您有任何問題或疑問,請隨時通過評論與我們分享。 我們很樂意聽取您的意見。
如果您想了解有關此主題的更多信息,您應該前往我們的課程部分。 你會在那裡找到很多有價值的資源。
如果您想了解數據科學,請查看 IIIT-B 和 upGrad 的數據科學 PG 文憑,該文憑專為在職專業人士而設,提供 10 多個案例研究和項目、實用的實踐研討會、與行業專家的指導、1-與行業導師面對面交流,400 多個小時的學習和頂級公司的工作協助。
馬爾可夫鏈在現實生活中有什麼應用嗎?
處理單獨的審判程序的最重要的測試之一是馬爾可夫鏈。 在金融和經濟學中,馬爾可夫鏈用於表示各種事件,例如市場崩盤和資產價值。 馬爾可夫鏈應用於廣泛的學術領域,包括生物學、經濟學,甚至現實世界的場景。 停車場有一定數量的可用停車位,但任何時候有多少停車位可用基於眾多因素或變量組合的馬爾可夫模型來表徵。 馬爾可夫鏈經常用於創建虛擬文本、冗長的文章和演講。
關於馬爾可夫鏈,均衡一詞是什麼意思?
如果 πT P = πT,則分佈 πT 稱為平衡分佈。 平衡是指 Xt 的分佈不會隨著我們通過馬爾可夫鏈而改變的情況。 事實上,馬爾可夫鏈的顯著特徵是潛在的未來狀態是固定的,無論過程如何達到其當前狀態。 換句話說,轉換到任何給定條件的可能性完全由當前狀態和經過的時間量決定。
馬爾可夫鍊是時間同質的嗎?
如果在任何兩個時間兩個給定狀態值之間的轉移概率僅依賴於這些時間之間的差異,則該過程是時間同質的。 馬爾可夫鍊是同質的或非同質的都有條件。 當且僅當它們與時間無關時,才稱馬爾可夫鏈的轉移概率是齊次的。 馬爾可夫屬性保留在非齊次馬爾可夫鏈 (nhmc) 中,儘管轉移概率可能隨時間變化。 本節列出了保證此類鏈中存在變化限制的標準,目的是將它們應用於模擬退火。