您应该了解的 10 大深度学习技术
已发表: 2020-05-29目录
介绍
在过去的几年里,机器学习和人工智能以其突破性的创新改变了我们周围的世界。 此外,正是各种深度学习技术将机器学习提升到了一个全新的水平,在人脑神经网络的启发下,机器可以学习识别任务。 这就是我们在智能手机和电视遥控器上进行语音控制的原因。
有不同类型的深度学习模型既准确又有效地解决了对人脑来说过于复杂的问题。 这是如何做:
十大深度学习技术
1. 经典神经网络
也称为全连接神经网络,它通常由其多层感知器识别,其中神经元连接到连续层。 它由美国心理学家 Fran Rosenblatt 于1958 年设计。它涉及将模型改编为基本的二进制数据输入。 该模型包含三个功能:它们是:
- 线性函数:准确地说,它代表一条线,将其输入乘以一个常数乘数。
- 非线性函数:进一步分为三个子集:
- Sigmoid 曲线:它是一个被解释为 S 形曲线的函数,其范围从 0 到 1。
- 双曲正切 (tanh)是指范围为 -1 到 1 的 S 形曲线。
- 整流线性单元(ReLU):它是一个单点函数,当输入值小于设定值时产生 0,如果给定输入值高于设定值则产生线性倍数。
最适用于:
- 任何具有 CSV 格式的行和列的表数据集
- 输入真实值的分类和回归问题
- 任何具有最高灵活性的模型,例如 ANNS
2. 卷积神经网络
CNN是经典人工神经网络模型的高级和高潜力类型。 它是为处理更高的复杂性、预处理和数据编译而构建的。 它参考了动物大脑视觉皮层中神经元的排列顺序。
CNN 可以被认为是专门研究图像和非图像数据的最有效灵活的模型之一。 它们有四个不同的组织:

- 它由单个输入层组成,通常是用于分析原始图像数据的神经元的二维排列,类似于照片像素。
- 一些 CNN 还包含一个单维神经元输出层,通过分散的连接卷积层处理其输入上的图像。
- CNN 还存在称为采样层的第三层,以限制相应网络层中涉及的神经元数量。
- 总体而言,CNN 具有将采样连接到输出层的单个或多个连接层。
该网络模型可以帮助以较小的单元或块的形式获取相关图像数据。 卷积层中存在的神经元负责前一层中的神经元簇。
将输入数据导入卷积模型后,构建 CNN 涉及四个阶段:
- 卷积:该过程从输入数据中导出特征图,然后将函数应用于这些图。
- Max-Pooling:它帮助 CNN 根据给定的修改来检测图像。
- 展平:在这个阶段,生成的数据会被展平以供 CNN 分析。
- 全连接:通常被描述为为模型编译损失函数的隐藏层。
CNN 足以完成包括图像识别、图像分析、图像分割、视频分析和自然语言处理在内的任务。 然而,在其他场景中,CNN 网络可能被证明是有用的,例如:
- 包含 OCR 文档分析的图像数据集
- 任何二维输入数据,可以进一步转换为一维以进行更快的分析
- 该模型需要参与其架构以产生输出。
阅读更多:卷积神经网络
3. 递归神经网络 (RNN)
RNN 最初旨在帮助预测序列,例如,长短期记忆 (LSTM)算法以其多种功能而闻名。 这样的网络完全在可变输入长度的数据序列上工作。
RNN 将从其先前状态获得的知识作为当前预测的输入值。 因此,它可以帮助实现网络中的短期记忆,从而有效管理股票价格变化或其他基于时间的数据系统。
如前所述,有两种类型的 RNN 设计有助于分析问题。 他们是:
- LSTM:在使用内存预测时间序列中的数据时很有用。 它具有三个门:输入、输出和忘记。
- 门控 RNN:也可用于通过内存对时间序列进行数据预测。 它有两个门——更新和重置。
最适用于:
- 一对一:连接到单个输出的单个输入,例如图像分类。
- 一对多:链接到输出序列的单个输入,例如包含来自单个图像的多个单词的图像字幕。
- 多对一:一系列输入产生单一输出,如情绪分析。
- 多对多:一系列输入产生一系列输出,如视频分类。
它还广泛用于语言翻译、对话建模等。
从世界顶级大学在线获取最佳机器学习课程。 获得硕士、Executive PGP 或高级证书课程以加快您的职业生涯。
4. 生成对抗网络
它结合了神经网络的两种深度学习技术——生成器和鉴别器。 虽然生成器网络产生人工数据,但鉴别器有助于辨别真实数据和虚假数据。
这两个网络都具有竞争力,因为生成器不断产生与真实数据相同的人工数据——鉴别器不断检测真实和非真实数据。 在需要创建图像库的场景中,生成器网络将为真实图像生成模拟数据。 然后它将生成一个反卷积神经网络。

然后将跟随一个图像检测器网络来区分真假图像。 从50% 的准确率开始,检测器需要提高其分类质量,因为生成器在其人工图像生成中会变得更好。 这种竞争将总体上有助于网络的有效性和速度。
最适用于:
- 图像和文本生成
- 图像增强
- 新药发现流程
5. 自组织地图
SOM 或自组织图在减少模型中随机变量数量的无监督数据的帮助下运行。 在这种类型的深度学习技术中,输出维度固定为二维模型,因为每个突触都连接到其输入和输出节点。
当每个数据点竞争其模型表示时,SOM 会更新最近节点或最佳匹配单元 (BMU)的权重。 基于 BMU 的接近程度,权重的值会发生变化。 由于权重本身被视为节点特征,因此该值表示节点在网络中的位置。
最适用于:
- 当数据集没有 Y 轴值时
- 分析数据集框架的项目探索
- 借助 AI 进行音乐、视频和文本方面的创意项目
6. 玻尔兹曼机
该网络模型没有任何预定义的方向,因此其节点以圆形排列连接。 由于这种独特性,这种深度学习技术被用于生成模型参数。
与之前所有的确定性网络模型不同,玻尔兹曼机模型被称为随机模型。
最适用于:
- 系统监控
- 搭建二元推荐平台
- 分析特定数据集
阅读:当今构建自己的人工智能系统的分步方法
7. 深度强化学习
在理解深度强化学习技术之前,强化学习是指代理与环境交互以修改其状态的过程。 代理可以观察并采取相应的行动,代理通过与情况交互来帮助网络达到其目标。
在这里,在这个网络模型中,有一个输入层、输出层和几个隐藏的多层——其中环境的状态是输入层本身。 该模型致力于不断尝试预测在给定情况下采取的每项行动的未来回报。
最适用于:
- 棋盘游戏,如国际象棋、扑克
- 自驾车
- 机器人技术
- 库存管理
- 资产定价等财务任务
8. 自动编码器
作为最常用的深度学习技术类型之一,该模型根据其输入自动运行,然后采用激活函数和最终输出解码。 这种瓶颈形成导致产生较少类别的数据并利用大多数固有数据结构。
自动编码器的类型是:
- 稀疏- 隐藏层的数量超过输入层,以进行泛化方法以减少过度拟合。 它限制了损失函数并防止自动编码器过度使用其所有节点。
- 去噪——在这里,输入的修改版本被随机转换为 0。
- 收缩——在损失函数中添加惩罚因子以限制过度拟合和数据复制,以防隐藏层数量超过输入层。
- Stacked – 对于自动编码器,一旦添加了另一个隐藏层,它就会导致两个编码阶段到一个解码阶段。
最适用于:
- 特征检测
- 建立一个引人注目的推荐模型
- 向大型数据集添加特征
阅读:深度学习中的正则化
9. 反向传播
在深度学习中,反向传播或反向传播技术被称为神经网络学习数据预测中任何错误的中心机制。 另一方面,传播是指通过专用信道在给定方向上传输数据。 整个系统可以在决策时刻根据信号正向传播工作,并反向发回任何有关网络缺陷的数据。
- 首先,网络分析参数并决定数据
- 其次,它是用损失函数加权的
- 第三,识别的错误被反向传播以自我调整任何不正确的参数
最适用于:
- 数据调试
10. 梯度下降
在数学上下文中,梯度是指具有可测量角度并且可以表示为变量之间关系的斜率。 在这种深度学习技术中,神经网络中产生的误差与数据参数的误差之间的关系可以表示为“x”和“y”。 由于变量在神经网络中是动态的,因此可以通过微小的变化来增加或减少误差。
许多专业人士将这项技术想象成一条从山坡上流下的河道。 这种方法的目标是——找到最优解。 由于神经网络中存在多个局部最小解决方案,其中数据可能会被困并导致更慢、不正确的编译 - 有一些方法可以避免此类事件。

作为山区的地形,神经网络中有一个特殊的函数,称为凸函数,它使数据以预期的速率流动并达到其最小值。 由于函数初始值的变化,数据进入最终目的地所采用的方法可能会有所不同。
最适用于:
- 更新给定模型中的参数
另请阅读:初学者的 15 个有趣的机器学习项目创意
包起来
有多种深度学习技术附带其功能和实用方法。 一旦确定了这些模型并将其置于正确的场景中,就可以基于开发人员使用的框架实现高端解决方案。 祝你好运!
查看 IIT Madras 的机器学习和云高级认证计划,这是该国最好的工程学校,创建一个计划,不仅可以教您机器学习,还可以使用云基础设施进行有效部署。 我们的这个计划的目标是打开该国最具选择性的学院的大门,让学习者获得惊人的师资和资源,以掌握高增长的技能
什么是一般对抗网络?
它是两种深度学习神经网络技术的混合体:生成器和判别器。 当生成器网络生成虚构数据时,鉴别器有助于区分真实数据和虚构数据。 因为生成器继续产生与真实数据相同的虚假数据——鉴别器继续识别真实和不真实的数据——这两个网络都具有竞争力。 在需要图像库的情况下,生成器网络将生成真实照片的模拟结果。 之后,它将创建一个反卷积神经网络。
自组织地图有什么用?
SOM 或自组织图通过使用无监督数据减少模型中随机变量的数量来工作。 当每个神经元连接到其入口和出口节点时,在这种深度学习技术中,结果维度被设置为二维模型。 SOM 调整最近节点或最佳匹配单元的值,因为每个数据点都为其模型表示 (BMU) 出价。 权重的值取决于 BMU 的接近程度。 因为权重本身被认为是节点特征,所以该值表示节点在网络中的位置。
什么是反向传播?
反向传播算法或反向传播方法是神经网络了解深度学习中数据预测中的任何失败的重要要求。 另一方面,传播是指通过定义的通道在特定方向上传输数据。 在选择的那一刻,整个系统可以根据信号正向传播工作,并在反向发送任何有关网络缺陷的数据。