人工智能投资入门：奠定基础（上）

已发表: 2022-03-11

执行摘要

什么是人工智能？

人工智能 (AI) 可以简单地解释为机器展示的智能，与人类和其他动物展示的自然智能形成对比。
机器学习是人工智能中使用的技术的子集，深度学习是机器学习中使用的技术的子集。
人工智能发展已经出现了三个重要的浪潮。第一次出现在 50 年代和 60 年代，第二次出现在 80 年代和 90 年代，第三次开始于 10 年前，自 2016 年以来（AlphaGo）开始崭露头角。

这波AI有什么特别之处？

这波人工智能浪潮是由深度学习的增长和普及推动的。
虽然深度学习技术自 60 年代就已经出现，但直到最近几年，所需的计算能力和数据还不足以支持大规模商业应用。
深度学习如此令人兴奋的原因在于，简单地说，深度学习比其他学习算法具有更强大的性能。

成功的人工智能应用程序的关键组成部分。

人工智能应用程序需要解决定义明确（具体）和理想（针对紧急和明确的客户痛点）的问题。面部识别、机器翻译、无人驾驶汽车、搜索引擎优化，都是定义明确的理想问题。然而，缺乏明确定义的理想问题是难以生产例如通用房屋清洁机器人的原因。
机器学习算法需要访问干净且标记良好的数据。这个数据收集练习可能很困难，也可能很容易，这取决于您正在开发的商业应用程序。
人工智能业务需要开发强大且可扩展的算法。要实现这一点，必须具备三个条件：大量标记良好的数据、合适的人才以及对深度学习是解决问题的正确技术的信心。
成功的人工智能应用需要大量的计算能力。人工智能算法（如深度学习神经网络）越先进，需要的计算能力越强，手头的操作成本就越高。

在过去的几年里，全世界见证了围绕人工智能 (AI) 的兴趣爆炸式增长。曾经主要局限于科幻类型的概念，人工智能已经成为我们日常生活的一部分。我们一直在新闻中读到它，看到看起来很吓人的机器人随着Uptown Funk的曲调跳舞的视频，并听到 AI 应用程序如何渗透到我们日常生活中最意想不到的领域。但这是炒作吗？

它可能是。根据 Gartner 的新兴技术炒作周期，包括 AI PaaS（平台即服务）、人工智能、自动驾驶、深度学习在内的民主化 AI 趋势都处于曲线上的不同点，其中深度神经网络处于峰值夸大的期望。然而，我们也已经每天都从人工智能中受益。从 Siri 到 Cortana 再到 Alexa，我们现在可以与智能助手交谈。从 Google 的 AI 搜索引擎到 Instagram 过滤器，我们现在可以享受快速、更相关的需求响应带来的便利。在人工智能创新蓬勃发展的中国，Face++ 的面部识别技术等公司正在为银行的即时身份验证提供支持，而 TikTok 等应用程序则将短视频推送给数百万青少年（事实上，这样做引起了相当大的争议）。

我个人认为，虽然肯定有一些过度炒作的期望和业务，但人工智能是未来。我创立了自己的早期人工智能初创公司，以抓住这个千载难逢的机会参与技术革命。作为一名前风险投资人，我也一直在寻找人工智能的投资机会。因此，我相信，尽管空间周围存在不可否认的噪音，但人工智能投资的巨大增长也是有道理的。

但考虑到这一点，令我感到惊讶的是，尤其是在投资界，在理解上仍然存在很大差距。投资者热衷于投入资金，但他们往往缺乏重要的基础知识，在我看来，这些知识是成为该领域有效投资者所必需的。因此，本文的目的是为那些有兴趣投资这个令人兴奋的领域的人分享和提供一些有用的背景和信息。鉴于手头话题的广度，我将我的想法分为两部分，第一部分旨在讨论开始人工智能之旅需要了解的一些基本要素 - 101 之类的。本系列的第二部分将更加实用，并将更深入地探讨如何评估 AI 投资以及不同的投资方式这一主题。

注意这篇文章不是技术性的。它面向投资者和更广泛的金融界，因此也面向非技术读者。

什么是人工智能？

人工智能实际上有很多定义，所以当我被要求定义它时，我通常默认使用古老的维基百科，对于非技术观众，我认为它提供了一个令人满意的定义：

人工智能 (AI)，有时称为机器智能，是由机器展示的智能，与人类和其他动物展示的自然智能形成对比。

换句话说，任何非自然智能都是“人工”智能，无论它是如何实现的。用于实现 AI 的技术包括 if-then 规则、逻辑、决策树、回归和机器学习（包括深度学习）。我最喜欢和有趣的解释人工智能如何工作的工具之一是这个关于计算机如何学习玩超级马里奥的视频。

谈到人工智能，你总会听到这三个关键术语：人工智能、机器学习和深度学习。它们有时可以互换使用，但它们是不同的。 简而言之，机器学习是人工智能中使用的技术的一个子集。 深度学习是机器学习中使用的技术的一个子集。

Nvidia 博客很好地总结了这三个术语之间的关系。它还提供了对 AI 开发的三个浪潮的方便概述。人工智能的第一波浪潮是在 50 年代和 60 年代，出现了一些重要的里程碑，例如 IBM 701 在跳棋比赛中战胜跳棋大师罗伯特·尼利。 80、90年代，深蓝在国际象棋上击败了人类大师卡斯帕罗夫。 2016 年 3 月，AlphaGo 击败了围棋第一名李世石。每次人工智能在游戏中击败人类高手，都为人工智能掀起了一个新的炒作阶段。然后，由于该技术无法提供满足公众期望的应用程序，人工智能的炒作将变成人工智能的寒冬，投资和研究经费减少。

如前所述，机器学习是人工智能的一个子集。根据英伟达的说法，机器学习最基本的是“使用算法解析数据，从中学习，然后对世界上的某事做出决定或预测的实践。因此，机器不是使用一组特定指令手动编写软件例程来完成特定任务，而是使用大量数据和算法进行‘训练’，使其能够学习如何执行任务。” 机器学习的一个非常常见的例子是垃圾邮件过滤器。 Google 的垃圾邮件过滤器可以通过识别“Prince”、“Nigeria”和“luxury watch”等触发词来识别垃圾邮件。它还可以继续从用户对垃圾邮件的手动分类中“学习”。例如，Google 的垃圾邮件过滤器漏掉了一封带有“发送 1000 美元以将这种独家抗癌药物发送到以下银行帐户”的电子邮件。一旦用户将其标记为垃圾邮件，Gmail 就会分析该特定电子邮件中的所有关键字，并“学习”将包含“1000 美元”、“毒品”和“银行账户”组合词的电子邮件视为垃圾邮件。专业人士使用许多数学模型来进行机器学习，例如回归、物流、贝叶斯网络、聚类。

这波AI有什么特别之处？

这波人工智能浪潮是由深度学习的流行推动的。作为机器学习的一个子集，深度学习是最近才发明的。事实上，根据 Wikipedia 的说法，“第一个用于监督、深度、前馈、多层感知器的通用工作学习算法是由 Alexey Ivakhnenko 和 Lapa 在 1965 年发布的”。然而，由于计算能力和数据还不够先进，无法支持深度学习技术的大规模商业应用，直到 2006 年 Geoffrey Hinton 等人发表了他们的开创性论文“A Fast Learning Algorithm for Deep Belief网。” 尽管上世纪 90 年代和 2000 年代前半期的 AI 寒冬，包括深度学习的三位学术大师 Geoffrey Hinton、Yann LeCun 和 Yoshua Bengio 在内的少数学者仍在学术领域继续研究深度学习。计算能力的快速突破，例如云计算和 GPU，再加上数字经济中大数据的可用性，使得深度学习算法在过去十年中成为可能。例如，谷歌的自动驾驶汽车研究始于 2009 年。

从技术上讲，深度学习可以定义为“一类机器学习算法，它：

使用级联的多层非线性处理单元进行特征提取和转换。每个连续的层都使用前一层的输出作为输入。
以有监督（例如，分类）和/或无监督（例如，模式分析）的方式学习。
学习对应于不同抽象层次的多层次表示；这些层次形成了概念的层次结构。”

与传统机器学习相比，关键是“多层”。例如，你如何区分猫和狗？如果你使用机器学习，你可能会提取一些狗和猫共有的特征，比如两只耳朵、一张毛茸茸的脸、眼睛和鼻子和嘴巴之间的距离等。你可能会得到这样的结果图片是 50% 的狗，50% 的猫 - 不是很有用。然而，使用深度学习，你甚至不知道猫和狗的区别特征是什么，但机器通过多层创建新特征和数百（或数千）个统计模型，将提供更多准确的输出 - 例如 90% 的狗，10% 的猫。下面的两张图表说明了神经网络如何“学习”，以及经典机器学习和神经网络之间的区别。

读完以上内容后，读者可能会摸不着头脑，这是正确的。但回到我们最初的目的：从投资者的角度来看，深度学习有什么特别之处？人们可以用各种更复杂的技术解释来回答这个问题，但简单地说，左下图很好地说明了这一点：深度学习比其他学习算法具有更强大的性能。以微软博客中详述的语音识别为例（右下图）：原来的 1988 年语音识别错误率为 60-70%，而使用深度学习的新微软系统在 2014 年仅为 6.3%。

成功的人工智能应用的关键组成部分

我相信机器学习（包括深度学习）产品的成功有 4 个关键要素：明确定义的理想问题、数据、算法和计算能力。

首先，人工智能应用程序需要解决一个定义明确的（具体的）和可取的（针对紧急和明确的客户痛点）的问题。想想计算机被教导在 3 种不同的 AI 浪潮中玩的不同游戏：跳棋、国际象棋、围棋。它们是非常明确的问题，因此计算机更容易解决。面部识别、机器翻译、无人驾驶汽车、搜索引擎优化，都是定义明确的理想问题。然而，缺乏明确定义的理想问题是为什么很难生产例如普通的房屋清洁机器人。简单的家务活，例如收集杯子和把衣服放在篮子里，需要解决太多的问题。例如，它需要机器识别需要拾取哪些物体（杯子、脏衣服和不干净的衣服等），去哪里，以及如何去那里（避开家庭中的障碍物，前往想要的地方）位置），以所需的功率处理每个物体，以免损坏杯子或衣物等。

其次，开发机器学习算法需要访问干净且标记良好的数据。这是因为这些算法是通过向不同的统计模型提供大量标记良好的数据来构建的，以建立必要的预测关系。这个数据收集练习可能很困难，也可能很容易，这取决于您正在开发的商业应用程序。例如，为了收集开发酿酒葡萄田计算机视觉算法所需的必要数据，我的创业公司需要来自不同地点、不同品种和更困难的田野图像——不同季节。每个季节为一年，要获得满意的产品需要数年时间。相比之下，如果你想在中国开发一个好的人脸识别算法，比如收集1000万张图像，你只需要在北京一条繁忙的街道上架起一个摄像头一周，任务就完成了。另一个例子是中国排名第一的人工智能个性化新闻聚合器今日头条，它了解你的个人新闻偏好，只向你展示与你最相关的新闻。在这种情况下，收集数据再次容易得多，例如您在每个新闻类别中阅读的文章数量、您在每篇文章上花费的时间等等。

第三，人工智能业务需要开发强大且可扩展的算法。要实现这一点，必须具备三个条件：大量标记良好的数据（如上所述）、合适的人才以及对深度学习是解决问题的正确技术的信心。人工智能业务需要合适的人才来开发必要的算法，但这些都是高度专业化、昂贵且稀缺的。例如，当我为我的初创公司寻找招聘时，我发现至少需要数据科学家（通常是博士）来开发算法原型，工程师来设计框架，程序员（TensorFlow、Python、C++ 等）来编码成可扩展的程序，然后人们将它们组合在一起（产品经理、用户体验、用户界面等）。

另一个考虑因素是计算能力。为什么？因为深度学习神经网络比其他人工智能方法需要更多的计算。例如，对于识别图像中的狗的相同任务，使用非深度学习算法训练模型可能需要给定 1GB 数据集的 10 个统计模型。比如说，深度神经网络模型可能需要 1000 个统计模型来运行 100 GB 的数据集。使用网络的结果更好，但所需的计算能力要大得多。因此，这些模型不仅需要一台计算机（就像我们在个人计算机上所做的那样），还需要分布式计算，每个 GPU 处理 5% 的计算量，这样 20 个 GPU 就可以处理所需的计算量。反过来，这意味着必须构建自己的 GPU 集群服务器或从 AWS 等平台租用计算能力。来自云计算或您自己的服务器的计算能力是昂贵的，尽管公平地说计算的单位成本应该不断下降（根据摩尔定律）。

结论

许多人认为现在是看到人工智能突破和创业的最佳时机，因为许多行业和消费者互联网的数字化使得大量有目的地收集、组织清晰的数字数据变得可用。 Nvidia 的 GPU 和英特尔的 FPGA 的发展使得进行必要的计算变得更便宜、更快。 因此，当前的人工智能创新浪潮是由深度学习的重要进展推动的。

但是，要使 AI 应用程序成功，需要一个明确定义的理想问题、数据、算法和强大的计算能力。对于阅读本文的高管考虑使用 AI 来增强业务能力，上述四个关键组件也适用。

怎样才能更多地了解人工智能？有很多书籍、研讨会、Coursera 课程、研究论文和深度学习等组织可以了解人工智能。因为这篇文章的重点是针对想了解人工智能基础知识的投资者，所以我没有触及很多热门的人工智能话题，比如人工智能的潜在威胁、行业未来前景、人工智能投资、专业人士等。以及不同算法（例如 CNN）、原型与扩展、主要编程语言等的缺点。在本系列的第 2 部分中，我将深入探讨如何从投资者的角度评估 AI 公司。