人工智能投資入門：奠定基礎（上）

已發表: 2022-03-11

執行摘要

什麼是人工智能？

人工智能 (AI) 可以簡單地解釋為機器展示的智能，與人類和其他動物展示的自然智能形成對比。
機器學習是人工智能中使用的技術的子集，深度學習是機器學習中使用的技術的子集。
人工智能發展已經出現了三個重要的浪潮。第一次出現在 50 年代和 60 年代，第二次出現在 80 年代和 90 年代，第三次開始於 10 年前，自 2016 年以來（AlphaGo）開始嶄露頭角。

這波AI有什麼特別之處？

這波人工智能浪潮是由深度學習的增長和普及推動的。
雖然深度學習技術自 60 年代就已經出現，但直到最近幾年，所需的計算能力和數據還不足以支持大規模商業應用。
深度學習如此令人興奮的原因在於，簡單地說，深度學習比其他學習算法具有更強大的性能。

成功的人工智能應用程序的關鍵組成部分。

人工智能應用程序需要解決定義明確（具體）和理想（針對緊急和明確的客戶痛點）的問題。面部識別、機器翻譯、無人駕駛汽車、搜索引擎優化，都是定義明確的理想問題。然而，缺乏明確定義的理想問題是難以生產例如通用房屋清潔機器人的原因。
機器學習算法需要訪問乾淨且標記良好的數據。這個數據收集練習可能很困難，也可能很容易，這取決於您正在開發的商業應用程序。
人工智能業務需要開發強大且可擴展的算法。要實現這一點，必須具備三個條件：大量標記良好的數據、合適的人才以及對深度學習是解決問題的正確技術的信心。
成功的人工智能應用需要大量的計算能力。人工智能算法（如深度學習神經網絡）越先進，需要的計算能力越強，手頭的操作成本就越高。

在過去的幾年裡，全世界見證了圍繞人工智能 (AI) 的興趣爆炸式增長。曾經主要局限於科幻類型的概念，人工智能已經成為我們日常生活的一部分。我們一直在新聞中讀到它，看到看起來很嚇人的機器人隨著Uptown Funk的曲調跳舞的視頻，並聽到 AI 應用程序如何滲透到我們日常生活中最意想不到的領域。但這是炒作嗎？

它可能是。根據 Gartner 的新興技術炒作週期，包括 AI PaaS（平台即服務）、人工智能、自動駕駛、深度學習在內的民主化 AI 趨勢都處於曲線上的不同點，其中深度神經網絡處於峰值誇大的期望。然而，我們也已經每天都從人工智能中受益。從 Siri 到 Cortana 再到 Alexa，我們現在可以與智能助手交談。從 Google 的 AI 搜索引擎到 Instagram 過濾器，我們現在可以享受快速、更相關的需求響應帶來的便利。在人工智能創新蓬勃發展的中國，Face++ 的面部識別技術等公司正在為銀行的即時身份驗證提供支持，而 TikTok 等應用程序則將短視頻推送給數百萬青少年（事實上，這樣做引起了相當大的爭議）。

我個人認為，雖然肯定有一些過度炒作的期望和業務，但人工智能是未來。我創立了自己的早期人工智能初創公司，以抓住這個千載難逢的機會參與技術革命。作為一名前風險投資人，我也一直在尋找人工智能的投資機會。因此，我相信，儘管空間周圍存在不可否認的噪音，但人工智能投資的巨大增長也是有道理的。

但考慮到這一點，令我感到驚訝的是，尤其是在投資界，在理解上仍然存在很大差距。投資者熱衷於投入資金，但他們往往缺乏重要的基礎知識，在我看來，這些知識是成為該領域有效投資者所必需的。因此，本文的目的是為那些有興趣投資這個令人興奮的領域的人分享和提供一些有用的背景和信息。鑑於手頭話題的廣度，我將我的想法分為兩部分，第一部分旨在討論開始人工智能之旅需要了解的一些基本要素 - 101 之類的。本系列的第二部分將更加實用，並將更深入地探討如何評估 AI 投資以及不同的投資方式這一主題。

注意這篇文章不是技術性的。它面向投資者和更廣泛的金融界，因此也面向非技術讀者。

什麼是人工智能？

人工智能實際上有很多定義，所以當我被要求定義它時，我通常默認使用古老的維基百科，對於非技術觀眾，我認為它提供了一個令人滿意的定義：

人工智能 (AI)，有時稱為機器智能，是由機器展示的智能，與人類和其他動物展示的自然智能形成對比。

換句話說，任何非自然智能都是“人工”智能，無論它是如何實現的。用於實現 AI 的技術包括 if-then 規則、邏輯、決策樹、回歸和機器學習（包括深度學習）。我最喜歡和有趣的解釋人工智能如何工作的工具之一是這個關於計算機如何學習玩超級馬里奧的視頻。

談到人工智能，你總會聽到這三個關鍵術語：人工智能、機器學習和深度學習。它們有時可以互換使用，但它們是不同的。 簡而言之，機器學習是人工智能中使用的技術的一個子集。 深度學習是機器學習中使用的技術的一個子集。

Nvidia 博客很好地總結了這三個術語之間的關係。它還提供了對 AI 開發的三個浪潮的方便概述。人工智能的第一波浪潮是在 50 年代和 60 年代，出現了一些重要的里程碑，例如 IBM 701 在跳棋比賽中戰勝跳棋大師羅伯特·尼利。 80、90年代，深藍在國際象棋上擊敗了人類大師卡斯帕羅夫。 2016 年 3 月，AlphaGo 擊敗了圍棋第一名李世石。每次人工智能在遊戲中擊敗人類高手，都為人工智能掀起了一個新的炒作階段。然後，由於該技術無法提供滿足公眾期望的應用程序，人工智能的炒作將變成人工智能的寒冬，投資和研究經費減少。

如前所述，機器學習是人工智能的一個子集。根據英偉達的說法，機器學習最基本的是“使用算法解析數據，從中學習，然後對世界上的某事做出決定或預測的實踐。因此，機器不是使用一組特定指令手動編寫軟件例程來完成特定任務，而是使用大量數據和算法進行‘訓練’，使其能夠學習如何執行任務。” 機器學習的一個非常常見的例子是垃圾郵件過濾器。 Google 的垃圾郵件過濾器可以通過識別“Prince”、“Nigeria”和“luxury watch”等觸發詞來識別垃圾郵件。它還可以繼續從用戶對垃圾郵件的手動分類中“學習”。例如，Google 的垃圾郵件過濾器漏掉了一封帶有“發送 1000 美元以將這種獨家抗癌藥物發送到以下銀行帳戶”的電子郵件。一旦用戶將其標記為垃圾郵件，Gmail 就會分析該特定電子郵件中的所有關鍵字，並“學習”將包含“1000 美元”、“毒品”和“銀行賬戶”組合詞的電子郵件視為垃圾郵件。專業人士使用許多數學模型來進行機器學習，例如回歸、物流、貝葉斯網絡、聚類。

這波AI有什麼特別之處？

這波人工智能浪潮是由深度學習的流行推動的。作為機器學習的一個子集，深度學習是最近才發明的。事實上，根據 Wikipedia 的說法，“第一個用於監督、深度、前饋、多層感知器的通用工作學習算法是由 Alexey Ivakhnenko 和 Lapa 在 1965 年發布的”。然而，由於計算能力和數據還不夠先進，無法支持深度學習技術的大規模商業應用，直到 2006 年 Geoffrey Hinton 等人發表了他們的開創性論文“A Fast Learning Algorithm for Deep Belief網。” 儘管上世紀 90 年代和 2000 年代前半期的 AI 寒冬，包括深度學習的三位學術大師 Geoffrey Hinton、Yann LeCun 和 Yoshua Bengio 在內的少數學者仍在學術領域繼續研究深度學習。計算能力的快速突破，例如雲計算和 GPU，再加上數字經濟中大數據的可用性，使得深度學習算法在過去十年中成為可能。例如，谷歌的自動駕駛汽車研究始於 2009 年。

從技術上講，深度學習可以定義為“一類機器學習算法，它：

使用級聯的多層非線性處理單元進行特徵提取和轉換。每個連續的層都使用前一層的輸出作為輸入。
以有監督（例如，分類）和/或無監督（例如，模式分析）的方式學習。
學習對應於不同抽象層次的多層次表示；這些層次形成了概念的層次結構。”

與傳統機器學習相比，關鍵是“多層”。例如，你如何區分貓和狗？如果你使用機器學習，你可能會提取一些狗和貓共有的特徵，比如兩隻耳朵、一張毛茸茸的臉、眼睛和鼻子和嘴巴之間的距離等。你可能會得到這樣的結果圖片是 50% 的狗，50% 的貓 - 不是很有用。然而，使用深度學習，你甚至不知道貓和狗的區別特徵是什麼，但機器通過多層創建新特徵和數百（或數千）個統計模型，將提供更多準確的輸出 - 例如 90% 的狗，10% 的貓。下面的兩張圖表說明了神經網絡如何“學習”，以及經典機器學習和神經網絡之間的區別。

讀完以上內容後，讀者可能會摸不著頭腦，這是正確的。但回到我們最初的目的：從投資者的角度來看，深度學習有什麼特別之處？人們可以用各種更複雜的技術解釋來回答這個問題，但簡單地說，左下圖很好地說明了這一點：深度學習比其他學習算法具有更強大的性能。以微軟博客中詳述的語音識別為例（右下圖）：原來的 1988 年語音識別錯誤率為 60-70%，而使用深度學習的新微軟系統在 2014 年僅為 6.3%。

成功的人工智能應用的關鍵組成部分

我相信機器學習（包括深度學習）產品的成功有 4 個關鍵要素：明確定義的理想問題、數據、算法和計算能力。

首先，人工智能應用程序需要解決一個定義明確的（具體的）和可取的（針對緊急和明確的客戶痛點）的問題。想想計算機被教導在 3 種不同的 AI 浪潮中玩的不同遊戲：跳棋、國際象棋、圍棋。它們是非常明確的問題，因此計算機更容易解決。面部識別、機器翻譯、無人駕駛汽車、搜索引擎優化，都是定義明確的理想問題。然而，缺乏明確定義的理想問題是為什麼很難生產例如普通的房屋清潔機器人。簡單的家務活，例如收集杯子和把衣服放在籃子裡，需要解決太多的問題。例如，它需要機器識別需要拾取哪些物體（杯子、髒衣服和不干淨的衣服等），去哪裡，以及如何去那裡（避開家庭中的障礙物，前往想要的地方）位置），以所需的功率處理每個物體，以免損壞杯子或衣物等。

其次，開發機器學習算法需要訪問乾淨且標記良好的數據。這是因為這些算法是通過向不同的統計模型提供大量標記良好的數據來構建的，以建立必要的預測關係。這個數據收集練習可能很困難，也可能很容易，這取決於您正在開發的商業應用程序。例如，為了收集開發釀酒葡萄田計算機視覺算法所需的必要數據，我的創業公司需要來自不同地點、不同品種和更困難的田野圖像——不同季節。每個季節為一年，要獲得滿意的產品需要數年時間。相比之下，如果你想在中國開發一個好的人臉識別算法，比如收集1000萬張圖像，你只需要在北京一條繁忙的街道上架起一個攝像頭一周，任務就完成了。另一個例子是中國排名第一的人工智能個性化新聞聚合器今日頭條，它了解你的個人新聞偏好，只向你展示與你最相關的新聞。在這種情況下，收集數據再次容易得多，例如您在每個新聞類別中閱讀的文章數量、您在每篇文章上花費的時間等。

第三，人工智能業務需要開發強大且可擴展的算法。要實現這一點，必須具備三個條件：大量標記良好的數據（如上所述）、合適的人才以及對深度學習是解決問題的正確技術的信心。人工智能業務需要合適的人才來開發必要的算法，但這些都是高度專業化、昂貴且稀缺的。例如，當我為我的初創公司尋找招聘時，我發現至少需要數據科學家（通常是博士）來開發算法原型，工程師來設計框架，程序員（TensorFlow、Python、C++ 等）來編碼成可擴展的程序，然後人們將它們組合在一起（產品經理、用戶體驗、用戶界面等）。

另一個考慮因素是計算能力。為什麼？因為深度學習神經網絡比其他人工智能方法需要更多的計算。例如，對於識別圖像中的狗的相同任務，使用非深度學習算法訓練模型可能需要給定 1GB 數據集的 10 個統計模型。比如說，深度神經網絡模型可能需要 1000 個統計模型來運行 100 GB 的數據集。使用網絡的結果更好，但所需的計算能力要大得多。因此，這些模型不僅需要一台計算機（就像我們在個人計算機上所做的那樣），還需要分佈式計算，每個 GPU 處理 5% 的計算量，這樣 20 個 GPU 就可以處理所需的計算量。反過來，這意味著必須構建自己的 GPU 集群服務器或從 AWS 等平台租用計算能力。來自云計算或您自己的服務器的計算能力是昂貴的，儘管公平地說計算的單位成本應該不斷下降（根據摩爾定律）。

結論

許多人認為現在是看到人工智能突破和創業的最佳時機，因為許多行業和消費者互聯網的數字化使得大量有目的地收集、組織清晰的數字數據變得可用。 Nvidia 的 GPU 和英特爾的 FPGA 的發展使得進行必要的計算變得更便宜、更快。 因此，當前的人工智能創新浪潮是由深度學習的重要進展推動的。

但是，要使 AI 應用程序成功，需要一個明確定義的理想問題、數據、算法和強大的計算能力。對於閱讀本文的高管考慮使用 AI 來增強業務能力，上述四個關鍵組件也適用。

怎樣才能更多地了解人工智能？有很多書籍、研討會、Coursera 課程、研究論文和深度學習等組織可以了解人工智能。因為這篇文章的重點是針對想了解人工智能基礎知識的投資者，所以我沒有觸及很多熱門的人工智能話題，比如人工智能的潛在威脅、行業未來前景、人工智能投資、專業人士等。以及不同算法（例如 CNN）、原型與擴展、主要編程語言等的缺點。在本系列的第 2 部分中，我將深入探討如何從投資者的角度評估 AI 公司。