马尔可夫链简介:先决条件、属性和应用

已发表: 2020-04-14

你有没有想过专家气象学家如何准确预测天气或谷歌如何对不同的网页进行排名? 他们如何在现实世界中制作迷人的 Python 应用程序。 这些计算很复杂,涉及多个动态变量,可以使用概率估计来解决。

当 Google 推出其 PageRank 算法时,它彻底改变了网络行业。 如果您熟悉该算法,您还必须知道它使用马尔可夫链。 在我们对马尔可夫链的介绍中,我们将简要介绍它们并了解它们是什么。 那么,让我们开始吧。

目录

先决条件

在我们开始讨论马尔可夫链之前,了解一些概念是必不可少的。 其中大部分来自概率论。 非数学上,您可以将随机变量的值定义为随机事件的结果。 因此,例如,如果变量是掷骰子的结果,那么它将是一个数字,而如果它是掷硬币的结果,那么它将是一个布尔值(0 或 1)。 这些可能结果的集合可以是连续的也可以是离散的。

所以我们可以说随机过程是一组设置索引的随机变量。 该集合代表不同的时间实例。 该集合可以是实数(连续过程)或自然数(离散过程)。

阅读: Python 中的内置数据结构

马尔可夫链简介

马尔可夫链得名于安德烈马尔可夫,他在 1906 年首次提出了这个概念。马尔可夫链是指包含随机变量的随机过程,这些变量根据概率规则和假设从一个状态转换到另一个状态。

你问这些概率规则和假设是什么? 这些被称为马尔可夫属性。 学习更多关于 Python教程中的马尔可夫链

什么是马尔可夫属性?

有很多组随机过程,例如自回归模型和高斯过程。 马尔可夫性质使研究这些随机过程变得相当容易。 马尔可夫属性指出,如果我们知道某个过程在特定时间的价值,我们将不会通过增加我们对其过去的了解来获得有关该过程未来结果的更多信息。

更详细的定义是:马尔可夫属性表示随机过程的概率仅取决于其当前状态和时间,并且与之前的其他状态无关。 这就是为什么它是一个无记忆的属性,因为它只取决于进程的当前状态。

齐次离散时间马尔可夫链是具有离散状态空间和时间的马尔可过程。 可以说,马尔可夫链是一系列离散的状态,具有马尔可夫性质。

这是马尔可夫链的数学表示:

X = ( X n ) n N =( X 0 , X 1 , X 2 , ...)

马尔可夫链的性质

让我们看一下马尔可夫链的基本特征,以更好地理解它们。 我们不会深入探讨这个主题,因为本文的目的是让您熟悉马尔可夫链的一般概念。

可还原性

马尔可夫链是不可约的。 这意味着如果它可以从另一个状态到达任何状态,它们就没有可还原性。 链不需要在一个时间步内从另一个状态到达一个状态; 它可以在多个时间步骤中这样做。 如果我们可以用图来表示链,那么图将是牢固连接的。

非周期性

假设一个状态的周期是 k。 如果 k = 1,则当任何类型的返回其状态需要 k 个时间步的倍数时,此状态是非周期性的。 当马尔可夫链的所有状态都是非周期性的,那么我们可以说马尔可夫链是非周期性的。

瞬态和循环状态

当你离开一个状态,并且有可能无法回到它时,我们说这个状态是短暂的。 另一方面,如果我们能够以概率 1 回到一个状态,在我们离开它之后,我们可以说这个属性是循环的。

我们可以有两种循环状态。 第一个是具有有限预期返回时间的正循环状态,第二个是具有无限预期返回时间的空循环状态。 预期返回时间是指我们离开该州时的平均复发时间。

马尔可夫链的应用

马尔可夫链在许多领域都有应用。 以下是它们的突出应用:

  • Google 的 PageRank 算法将网络视为马尔可夫模型。 可以说所有的网页都是状态,它们之间的链接是具有特定概率的转换。 换句话说,我们可以说,无论您在 Google 上搜索什么,您最终访问特定网页的可能性都是有限的。
  • 如果您使用 Gmail,您一定注意到了他们的自动填充功能。 此功能会自动预测您的句子,以帮助您快速撰写电子邮件。 马尔可夫链在这个领域有很大帮助,因为它们可以有效地提供这种预测。
  • 你听说过Reddit吗? 这是一个重要的社交媒体平台,里面充斥着特定主题的子版块(Reddit 中社区的名称)。 Reddit 使用马尔可夫链和模型来模拟 subreddit,以便更好地理解它们。

了解更多:现代生活中语言建模的演变

最后的想法

看来我们已经到了对马尔可夫链的介绍的结尾。 我们希望您发现这篇文章很有用。 如果您有任何问题或疑问,请随时通过评论与我们分享。 我们很乐意听取您的意见。

如果您想了解有关此主题的更多信息,您应该前往我们的课程部分。 你会在那里找到很多有价值的资源。

如果您想了解数据科学,请查看 IIIT-B 和 upGrad 的数据科学 PG 文凭,该文凭专为在职专业人士而设,提供 10 多个案例研究和项目、实用的实践研讨会、与行业专家的指导、1-与行业导师面对面交流,400 多个小时的学习和顶级公司的工作协助。

马尔可夫链在现实生活中有什么应用吗?

处理单独的审判程序的最重要的测试之一是马尔可夫链。 在金融和经济学中,马尔可夫链用于表示各种事件,例如市场崩盘和资产价值。 马尔可夫链应用于广泛的学术领域,包括生物学、经济学,甚至现实世界的场景。 停车场有一定数量的可用停车位,但任何时候有多少停车位可用基于众多因素或变量组合的马尔可夫模型来表征。 马尔可夫链经常用于创建虚拟文本、冗长的文章和演讲。

关于马尔可夫链,均衡一词是什么意思?

如果 πT P = πT,则分布 πT 称为平衡分布。 平衡是指 Xt 的分布不会随着我们通过马尔可夫链而改变的情况。 事实上,马尔可夫链的显着特征是潜在的未来状态是固定的,无论过程如何达到其当前状态。 换句话说,转换到任何给定条件的可能性完全由当前状态和经过的时间量决定。

马尔可夫链是时间同质的吗?

如果在任意两个时间两个给定状态值之间的转移概率仅依赖于这些时间之间的差异,则该过程是时间同质的。 马尔可夫链是同质的或非同质的都有条件。 当且仅当它们与时间无关时,才称马尔可夫链的转移概率是齐次的。 马尔可夫属性保留在非齐次马尔可夫链 (nhmc) 中,尽管转移概率可能随时间变化。 本节列出了保证此类链中存在变化限制的标准,目的是将它们应用于模拟退火。