监督与无监督学习：监督和无监督学习之间的区别

已发表: 2020-11-30

介绍

机器学习大致分为三种类型，即监督学习、无监督学习和强化学习。强化学习仍然是新的并且正在快速发展，所以让我们在本文中忽略它，深入研究监督和无监督学习。

在进入这两种学习类型的实际定义和用法之前，让我们先熟悉一下机器学习。机器学习是人工智能的一种应用，它为系统提供了自动学习和改进经验而无需明确编程的能力，这只是机器学习的教科书定义，因为本文主要是为数据科学和人工智能领域的新手编写的让我让你更清楚更有趣，以便你更好地理解和解释它。

让我们将婴儿视为我们的机器，我们需要帮助婴儿学习我们数字系统中的不同数字。为了帮助宝宝学习，我们需要给宝宝看一个不同的数字，并告诉他们每个数字是什么。

反复做这部分可以帮助宝宝学习和记忆数字。这只不过是无需明确编程即可自动学习和改进经验的能力，即机器学习。

阅读：机器学习项目理念

让我们从经典教科书对监督学习的定义重新开始，熟悉我们之前举的婴儿示例。监督学习是一项机器学习任务，它根据示例输入-输出对学习将输入映射到输出的函数。它从由一组训练示例组成的标记训练数据中推断出一个函数。

我讨厌任何教科书中写的定义，因为它们太正式了，很难理解，我更喜欢朋友用他自己的想法来解释定义。从长远来看，每当我试图回忆一个定义时，最终都会弹出一个朋友给出的示例解释，让我的生活更轻松。所以，在这篇文章中，让我成为你的朋友。

让我们再次以我们之前考虑的婴儿为例，在这种情况下，我们需要让婴儿学习并识别我们拥有的不同水果。让我们将苹果和橙子视为我们的两种水果，我们首先向宝宝展示这两张照片。我们还告诉宝宝哪张图片是哪种水果。

看着这些照片，宝宝知道水果是圆形的，红色水果是苹果，橙色水果是橙色。现在让我们给宝宝看一张橘子的新照片，让他找出这张照片是苹果还是橘子。

宝宝预测水果是橙色的。宝宝正确地预测水果是橙子，因为我们将苹果和橙子这两种水果分为两类，并要求宝宝学习什么是什么水果。如果我们用婴儿代替机器，这就是监督机器学习的工作原理。

监督机器学习进一步分为两类问题，称为分类和回归。

从名称本身，我们可以知道这是一个机器学习问题，我们需要将给定的数据分类为两个或更多类。我们采用的上述示例是一个分类问题，因为我们需要将给定的图片分类为 Apple 或 Orange 类。

当我们只有两个类来对我们的数据进行分类时，它被称为二元分类。但在现实世界的数据中，我们往往有不止一个类，它被称为多类分类。大多数人使用这些类型的学习来识别垃圾邮件，对客户进行分类，检查客户是否从运营商那里流失，以及更多用例。

另请阅读：机器学习职业

另一方面，回归处理的是连续数据，例如根据经验预测你的薪水。在这种情况下，我们不需要将数据放入任何类中，而是需要根据我们拥有的连续数据来预测连续值。

这些类型的问题在其数据集中具有连续的列，而分类往往具有分类列。这些类型的学习用于预测任何公司下一季度的财务增长、基于他以前的分数的学生分数等等。

无监督学习是一种机器学习，它在没有预先存在的标签和最少人工监督的数据集中寻找以前未检测到的模式。

与通常使用人工标记数据的监督学习相比，无监督学习（也称为自组织）允许对输入的概率密度进行建模。让我们考虑婴儿示例，以更好地理解无监督机器学习。

让我们在这个例子中使用一组猫狗的图片作为输入，在前面的例子中，宝宝知道这些图片是苹果和橙子的，因为我们已经对它们进行了标记和分类。

在这种情况下，婴儿什么都不知道，因此无法区分哪一只是猫，哪一只是狗。但是可以看出，与其他几张相比，很少有图片看起来相似。在这种情况下，我们无法标记数据，但我们仍然可以在数据中找到模式。这就是无监督机器学习的工作原理。

上面的例子清楚地描述了聚类问题，我们需要根据我们在数据中找到的模式对数据集进行聚类。聚类是一个非常重要的机器学习问题，许多公司倾向于使用这种技术从他们的数据中找到有价值的模式和见解。

在这篇文章中，我们了解了不同类型的机器学习，通过一个易于理解的例子来了解那些，研究了每种学习的进一步划分。本文仅涵盖机器学习问题的基础知识，每种类型的问题都有不同类型的机器学习算法。

如果您有兴趣了解有关机器学习的更多信息，请查看 IIIT-B 和 upGrad 的机器学习和人工智能 PG 文凭，该文凭专为工作专业人士设计，提供 450 多个小时的严格培训、30 多个案例研究和作业、IIIT- B 校友身份、5 个以上实用的实践顶点项目和顶级公司的工作协助。

机器学习和人工智能的 PG 文凭

了解更多