概率分布的类型 [举例说明]

已发表: 2020-12-24

任何对数据科学感兴趣的人都必须了解概率分布。 贝叶斯网络的推论统计等数据科学概念是在概率的基本概念之上发展起来的。 所以要进入统计学的世界,学习概率是必须的。

目录

什么是统计?

统计学正在使用不同的方法分析数学数字。

它让我们更全面地了解不同的数字。 数据科学的统计数据非常重要。 数据科学都是关于数字的,而统计数据使它更简单、更全面。

什么是概率?

概率是一个直观的概念。 我们在日常生活中不知不觉地使用它。 概率是事件发生可能性的度量。 例如,如果明天有 60% 的概率下雨,那么概率是 60%。

什么是概率分布?

概率分布以表格或方程的形式表示。 表格或方程式对应于统计实验的每个结果及其发生概率。

即使是简单的事件,例如抛硬币,也可以计算概率分布。

下表显示了抛硬币的每个结果的概率分布,每个结果及其概率。

头数可能性
0 0.25
1 0.50
2 0.25

它们也可以用于复杂事件,例如某种疫苗成功治疗 COVID-19 的概率。

概率分布的先决条件

要了解概率分布,您必须了解变量和随机变量。

  • 变量是一个符号(A、B、x、y 等)。 它采用任何指定的值集。
  • 在统计实验中,随机变量是变量的值。

通常,大写字母表示随机变量,小写字母表示其中一个值。

例如,

  • X 表示随机变量 X。
  • P(X) 表示 X 的概率。
  • P(X = x) 是随机变量 X 等于特定值的概率,用 x 表示。

例如,P(X = 1) 是随机变量 X 等于 1 的概率。

结帐:数据科学技能

概率分布的类型

统计学家将概率分布分为以下类型:

  • 离散概率分布
  • 连续概率分布

离散概率分布

离散概率函数是质量函数的概率。 它假定离散数量的值。

例如,当您掷硬币时,事件计数是离散函数,因为没有中间值。 抛硬币时只有正面或反面。 同样,在计算图书馆每小时借书的数量时,您可以数 31 或 32 本书,中间什么也没有。

离散概率分布的类型

  • 二项分布——伯努利分布只有两个结果,1 和 0。因此,随机变量 X 取值为 1,成功概率为 p,值为 0,失败概率为 q 或 1-p。

因此,如果你掷硬币,出现正面表示成功,出现尾部表示失败。

概率函数是 px(1-p)1-x 其中 x € (0, 1)

  • 正态分布——正态分布适用于最基本的情况。 它具有以下特点:
  1. 均值、中位数和众数重合。
  2. 分布曲线呈钟形。
  3. 分布曲线沿 x = μ 对称。
  4. 曲线下面积为 1。
  • 泊松分布s – 计算图书馆的图书数量属于概率分布。

泊松分布具有以下假设:

  • 一个成功的事件不会影响另一个成功事件的结果。
  • 短期内成功的概率等于长期内成功的概率。
  • 随着持续时间变小,在持续时间中成功的概率接近于零。

另请阅读:数据科学与数据分析

连续概率分布

它也被称为概率密度函数。 如果变量假定在任意两个值之间具有无限个值,则存在连续分布。 连续变量是在尺度上测量的,如身高、体重和温度。

与每个值都是非零结果的离散概率分布相比,连续分布对于特定函数的概率为零。 例如,当测量正好是 40 度的温度时,概率为零。

向世界顶尖大学学习机器学习课程获得硕士、Executive PGP 或高级证书课程以加快您的职业生涯。

连续概率分布的类型

  • 均匀分布——掷骰子时,结果是 1 到 6。这些结果的概率是相等的,这就是均匀分布。

假设随机变量 X 假设有 k 个不同的值。 此外,P(X=xk) 是常数。

P(X=xk) = 1/k

  • 累积概率分布——当随机变量 X 的值在指定范围内的概率时,累积概率就出现了。

假设你掷硬币,那么结果是正面朝上的概率是多少。 这是一个累积概率。

头数:x 概率 P(X=x) 累积概率:P(X ≤ x)
0 0.25 0.25
1 0.50 0.75
2 0.25 1.00

最后的想法

  • 概率分布显示给定数据生成过程的可能值的预期结果。
  • 概率分布是具有不同特征的不同类型。 特征主要由均值和标准差定义。
  • 投资者严重依赖概率分布来预测股票等资产随着时间的推移的回报并预测其风险。

如果您有热情并想了解更多关于人工智能的信息,您可以参加 IIIT-B 和 upGrad 的机器学习和深度学习 PG 文凭,该文凭提供 400 多个小时的学习、实践课程、工作帮助等等。

概率分布的性质是什么?

概率分布必须具有三个属性才能称为概率分布。 首先,它应该是可交换的。 这只是意味着当您将分布中的任何两个术语相加时,无论您首先添加哪个术语,您都应该得到相同的总数。 其次,它应该是完全单调的,这意味着每一项必须大于或等于前一项。 第三,分布应该是连续的,这意味着你不能在不同数字的概率之间存在差距。

如何在决策中使用概率分布?

在决策制定中,概率分布用于过程结果不确定的广泛应用中。 在赌场中,概率分布用于确定特定结果的几率。 在医学领域,概率分布用于确定特定疾病的可能性。 在商业中,概率分布用于确定某一行动的特定结果的可能性。 这些概率分布的应用是无限的。

什么是概率分布?

概率分布是一个数学函数,它给出随机变量是任何特定值的概率。 随机变量的概念是概率论的核心。 离散随机变量的概率分布采用其各个可能值的概率列表的形式。 一般来说,概率分布是一个数学函数,它描述给定空间中随机变量的特定值(或范围)出现的概率。