什么是几何深度学习?

已发表: 2020-12-22

在过去的几年中,递归神经网络 (RNN) 和卷积神经网络 (CNN) 等深度学习算法在解决语音识别、计算机视觉等各个领域的问题方面做出了重要的工作。 尽管结果具有很高的准确性,但它主要适用于欧几里得数据。

但是当涉及到网络科学、物理学、生物学、计算机图形学和推荐系统时,我们必须处理非欧几里得数据,即流形和图。 几何深度学习处理这种非欧几里得数据,将深度学习技术作为一个整体来处理流形或图形结构数据。

目录

什么是几何深度学习?

在过去的几年里,我们看到了深度学习和机器学习领域的显着进步。 计算机能力正在迅速增长,可用数据与 1980 年至 1990 年为新应用开发的算法相结合。

如果有一个领域从这一发展中受益匪浅,那就是表征学习。 表示学习是监督学习的一部分,也称为特征学习。 特征学习在很多应用中直接取代了特征工程。 供您参考,特征工程是一个处理开发描述符和特征以执行其他机器学习任务的领域。

最好的例子之一是使用卷积神经网络 (CNN) 进行对象检测、图像分类和实现高精度,从而为其他传统算法设定了基准。 ImageNet 在 2012 年进行了一场比赛,并在很大程度上超越了基于特征工程的 SOTA。

现在让我们来了解具有相似起源和蓬勃发展的未来的领域,几何深度学习。

几何深度学习一词最早由 Bronstein 等人提出。 在他们 2017 年发表的文章中,文章的标题是“几何深度学习:超越欧几里得数据”。

这是一个强有力的标题,它告诉几何深度学习即使在非欧几里得数据上也能够使用深度学习。 非欧几里得数据是一组无法放入二维空间的数据。

通常,在计算机图形领域非常广泛的图形专业化或网格来可视化非欧几里得数据。

左图为测地线距离,右图为欧式距离。 上图中的网格是一个人的脸。 现在,通过网格,最短的表面距离是两个地标之间的测地线距离。 而使用直线计算的两个地标之间的距离是欧几里得距离。

测地线距离是以非欧几里德形式表示任何网格的主要优势,因为它对在其上执行的任务更为重要。 并不是说我们天生就不能将非欧几里得数据转换成欧几里得数据,但实际情况是,失去性能和效率的代价很高。

非欧几里得数据的一个主要且重要的例子是图表。 图是这样一种数据结构,它由连接到关系或边的实体或节点组成。 图表可用于对几乎所有事物进行建模。

好吧,你不需要了解图论,你只需要阅读一点,这样你就可以使用过程中需要的软件库。 您应该对几何深度学习有非常清晰的基本知识,以便对图及其基本理论进行出色的介绍。

对于用于解决基于几何深度学习的问题的数据,如果您已经根据需要处理的数据识别出可实现的实例,或者相反; 那么这是最好的情况。

阅读:卷积神经网络

统计推理

我们要了解的是归纳推理和演绎推理的区别。 在演绎推理方面,一般术语用于得出特定结论或提出特定主张。 让我们结合这两个断言来形成一个例子。

“所有女孩在测试中得分 10/10”和“泰勒是个女孩”最终意味着“泰勒在测试中得分 10/10”。 归纳推理反之亦然; 在这里,一般的想法或结论是从特定的术语中得出的。 让我们举一个例子来形象化推理。 回答这个问题:

哪头奶牛只生产长寿命 (UHT) 牛奶? 如果你说“没有”,那么你就属于 21% 的受访青年。 5%的受访青年标注“奶牛”,10%标注“全部”,2%排成“母牛”和“黑白奶牛”,50%没有回答。

另请阅读:循环神经网络

从这个结果中有很多东西需要分析,但让我们考虑一下米尔卡奶牛的想法。 让我们以青年的观点来理解归纳推理形式的结论。 首先,“奶牛是一个特殊的品种”,“UHT奶是特殊的”,最终导致“UHT奶是奶牛产的”。

我们可以从中总结出什么? 归纳偏差或归纳推理是学习者的一组假设,足以解释其归纳和演绎干扰。 在设计归纳偏置算法时必须非常小心。 可以使用感应干扰来达到相当于演绎推理的结果。

有趣的事实:从更大的计算机科学中的数学语料库来看,如果有任何学科被认为是一门很难的学科,那就是离散数学中的图论。

然而,图论允许我们执行一些令人兴奋的任务,并通过深度学习提供惊人的见解。

图分割

图分割是对图的一个和所有组件(如节点(实体)、边(关系))进行分类的过程。 想想自动驾驶汽车,它们需要在定期间隔后对其环境进行监测,并预测行人接下来会做什么。

通常,人类行人要么被表示为三维的巨大边界框,要么被表示为更多程度的运动骨架。 随着更快更好的三维语义分割,自动驾驶汽车将拥有越来越多的算法,这使得感知变得可行。

图分类

在图分类中,该算法获取一个图或子图作为输入,并解释 n 个类别的一个输出,这些类别指定具有与预测相结合的确定性值。 它相当于所采用的网络有两个主要部分的图像分类。

第一个重要部分是特征提取器,它创建输入数据的光学表示。 然后为了将输出回归约束到一个特定的维度,使用了全连接层。 另一方面,多类分类需要一个 softmax 层。

必读:当今构建自己的人工智能系统的分步方法

底线

我们通过将几何深度学习放在整体深度学习环境中来深入理解几何深度学习。 我们可以得出结论,几何深度学习将不规则数据作为一个整体来处理,并且我们通过说明图在学习偏差中的作用是多么有希望来了解图。

如果您有兴趣了解有关深度学习技术、机器学习的更多信息,请查看 IIIT-B 和 upGrad 的机器学习和人工智能 PG 文凭,该文凭专为在职专业人士设计,提供 450 多个小时的严格培训、30 多个案例研究和任务、IIIT-B 校友身份、5 个以上实用的实践顶点项目和顶级公司的工作协助。

引领人工智能驱动的技术革命

机器学习和人工智能的 PG 文凭
了解更多