朴素贝叶斯解释：功能、优点和缺点、2022 年的应用

已发表: 2021-01-05

朴素贝叶斯是我们用来解决分类问题的机器学习算法。它基于贝叶斯定理。它是使用中最简单但功能最强大的 ML 算法之一，并在许多行业中得到应用。

假设您必须解决分类问题并创建了特征并生成了假设，但您的上级希望查看模型。您有大量数据点（数十万个数据点）和许多变量来训练数据集。这种情况的最佳解决方案是使用朴素贝叶斯分类器，与其他分类算法相比，它要快得多。

在本文中，我们将详细讨论此算法并了解其工作原理。我们还将讨论它的优点和缺点以及它的实际应用，以了解该算法的重要性。

加入来自世界顶级大学的在线深度学习课程——硕士、高管研究生课程和 ML 和 AI 高级证书课程，以加快您的职业生涯。

让我们开始吧：

朴素贝叶斯解释

朴素贝叶斯使用贝叶斯定理并假设所有预测变量都是独立的。换句话说，这个分类器假设一个类中一个特定特征的存在不会影响另一个特征的存在。

这是一个例子：如果水果是圆形的、橙色的并且直径约为 3.5 英寸，那么您会认为它是橙色的。现在，即使这些特征需要彼此存在，它们都独立于你假设这种特殊水果是橙色的。这就是为什么该算法的名称中包含“Naive”。

构建朴素贝叶斯模型非常简单，可以帮助您处理大量数据集。此外，这个方程在性能方面击败了许多先进的分类技术。

这是朴素贝叶斯的方程：

P(c|x) = P(x|c) P(c) / P(x)

P(c|x) = P(x1 | c) x P(x2 | c) x … P(xn | c) x P(c)

这里，P (c|x) 是根据类别 (c) 的预测变量 (x) 的后验概率。 P(c) 是类的先验概率，P(x) 是预测器的先验概率，P(x|c) 是特定类(c) 的预测器的概率。

除了考虑每个特征的独立性之外，朴素贝叶斯还假设它们的贡献相同。这是要记住的重要一点。

朴素贝叶斯如何工作？

为了理解朴素贝叶斯是如何工作的，我们应该讨论一个例子。

假设我们想要找到被盗汽车并拥有以下数据集：

序列号。	颜色	类型	起源	是偷来的吗？
1	红色的	运动的	国内的	是的
2	红色的	运动的	国内的	不
3	红色的	运动的	国内的	是的
4	黄色的	运动的	国内的	不
5	黄色的	运动的	进口的	是的
6	黄色的	越野车	进口的	不
7	黄色的	越野车	进口的	是的
8	黄色的	越野车	国内的	不
9	红色的	越野车	进口的	不
10	红色的	运动的	进口的	是的

根据我们的数据集，我们可以理解我们的算法做了以下假设：

它假设每个特征都是独立的。例如，汽车的颜色“黄色”与其原产地或类型无关。
它赋予每个功能相同的重要性。例如，只知道颜色和原点就可以正确预测结果。这就是为什么每个特征都同样重要并且对结果的贡献相同的原因。

现在，使用我们的数据集，我们必须根据小偷的特征对汽车是否偷车进行分类。每行都有单独的条目，列代表每辆车的特征。在第一排，我们有一辆被盗的国产红色跑车。我们将查明小偷是否会偷一辆红色国产 SUV（我们的数据集没有红色国产 SUV 的条目）。

我们可以将示例中的贝叶斯定理重写为：

P(y | X) = [P(X | y) P(y)P(X)]/P(X)

这里，y 代表类变量（Was it Stolen?），以显示窃贼是否不按条件偷车。 X 代表特征。

X = x1, x2, x3, ...., xn)

这里，x1, x2,…, xn 代表特征。我们可以将它们映射为类型、原点和颜色。现在，我们将替换 X 并展开链式法则得到以下内容：

P(y | x1, ..., xn) = [P(x1 | y) P(x2 | y) ... P(xn | y) P(y)]/[P(x1) P(x2) ... P(xn )]

您可以通过使用数据集并将它们的值放入等式中来获取每个值。对于数据集中的每个条目，分母将保持不变，以将其删除并注入比例。

P(y | x1, ..., xn) ∝ P(y) i = 1nP(xi | y)

在我们的示例中，y 只有两个结果，是或否。

y = argmaxyP(y) i = 1nP(xi | y)

我们可以创建一个频率表来计算每个特征的后验概率 P(y|x)。然后，我们将频率表建模为似然表，并使用朴素贝叶斯方程找到每个类的后验概率。我们预测的结果将是具有最高后验概率的类别。以下是可能性和频率表：

颜色频率表：

颜色	是否被盗（是）	是否被盗（否）
红色的	3	2
黄色的	2	3

颜色的似然表：

颜色	是不是被偷了[P(Yes)]	是不是被偷了[P(No)]
红色的	3/5	2/5
黄色的	2/5	3/5

频率类型表：

类型	是否被盗（是）	是否被盗（否）
运动的	4	2
越野车	1	3

类型的似然表：

类型	是不是被偷了[P(Yes)]	是不是被偷了[P(No)]
运动的	4/5	2/5
越野车	1/5	3/5

产地频率表：

起源	是否被盗（是）	是否被盗（否）
国内的	2	3
进口的	3	2

起源的可能性表：

起源	是不是被偷了[P(Yes)]	是不是被偷了[P(No)]
国内的	2/5	3/5
进口的	3/5	2/5

我们的问题对 X 有 3 个预测变量，因此根据我们之前看到的方程，后验概率 P(Yes | X) 如下：

P(是 | X) = P(红色 | 是) * P(SUV | 是) * P(国内 | 是) * P(是)

= ⅗ x ⅕ x ⅖ x 1

= 0.048

P(No | X) 将是：

P(No | X) = P(Red | No) * P(SUV | No) * P(国内| No) * P(No)

= ⅖ x ⅗ x ⅗ x 1

= 0.144

因此，由于后验概率 P(No | X) 高于后验概率 P(Yes | X)，我们的红色国产 SUV 将在“是否被盗？”中显示“否”。部分。

该示例应该向您展示了朴素贝叶斯分类器的工作原理。为了更好地理解朴素贝叶斯的解释，我们现在应该讨论它的优缺点：

朴素贝叶斯的优缺点

优点

该算法运行迅速，可以节省大量时间。
朴素贝叶斯适用于解决多类预测问题。
如果它对特征独立性的假设成立，它可以比其他模型表现得更好，并且需要更少的训练数据。
朴素贝叶斯比数值变量更适合分类输入变量。

缺点

朴素贝叶斯假设所有预测变量（或特征）都是独立的，在现实生活中很少发生。这限制了该算法在实际用例中的适用性。
该算法面临“零频率问题”，它将零概率分配给分类变量，该分类变量在测试数据集中的类别在训练数据集中不可用。最好使用平滑技术来解决这个问题。
在某些情况下，它的估计可能是错误的，所以你不应该非常认真地对待它的概率输出。

结帐：机器学习模型解释

朴素贝叶斯的应用解释

以下是该算法可以找到应用的一些领域：

文本分类

大多数时候，朴素贝叶斯发现使用文本分类是因为它在解决多类问题时具有独立性和高性能的假设。由于其速度和效率，它比其他算法具有更高的成功率。

情绪分析

机器学习最突出的领域之一是情感分析，该算法在那里也非常有用。情绪分析侧重于识别客户对某个主题（产品或服务）的看法是积极的还是消极的。

了解更多机器学习算法

朴素贝叶斯是一种简单有效的机器学习算法，用于解决多类问题。它在机器学习应用的许多突出领域都有用，例如情感分析和文本分类。

查看 IIT Madras 的机器学习和云高级认证计划，这是该国最好的工程学校，创建一个计划，不仅可以教您机器学习，还可以使用云基础设施进行有效部署。我们的这个计划的目标是打开该国最具选择性的学院的大门，让学习者获得惊人的师资和资源，以掌握高增长的技能

什么是朴素贝叶斯算法？

为了处理分类困难，我们采用朴素贝叶斯机器学习技术。贝叶斯定理支持它。它是使用中最基本但功能最强大的机器学习算法之一，在各个行业都有应用。假设您正在研究一个分类问题，并且您已经建立了特征和假设，但您的老板想查看模型。要训练数据集，您需要大量数据点（数千个数据点）和大量变量。比其他分类算法快得多的朴素贝叶斯分类器将是这种情况下的最佳选择。

朴素贝叶斯有哪些优点和缺点？

对于多类预测问题，朴素贝叶斯是一个不错的选择。如果特征独立性的前提仍然成立，它可以在使用少得多的训练数据的情况下胜过其他模型。分类输入变量比数值输入变量更适合朴素贝叶斯。

在朴素贝叶斯中，假设所有预测变量（或特征）都是独立的，这在现实生活中很少见。这限制了算法在现实世界场景中的可用性。您不应该认真对待它的概率输出，因为它的估计在某些情况下可能会偏离。

朴素贝叶斯有哪些实际应用？

朴素贝叶斯由于在处理多类问题时具有自治性和高性能的前提，经常被用于文本分类。情感分析是机器学习最流行的应用之一，这种技术也可以帮助解决这个问题。情绪分析的目标是确定客户对特定问题（产品或服务）是否有正面或负面的感觉。朴素贝叶斯分类器使用协同过滤来创建一个复杂的推荐系统，该系统可以预测用户是否会喜欢给定的产品（或资源）。