AI投資入門書:基礎を築く(パートI)

公開: 2022-03-11

エグゼクティブサマリー

AIとは何ですか?
  • 人工知能(AI)は、人間や他の動物によって表示される自然な知能とは対照的に、機械によって示される知能として簡単に説明できます。
  • 機械学習はAIで使用される手法のサブセットであり、深層学習は機械学習で使用される手法のサブセットです。
  • AI開発には3つの重要な波がありました。 1つ目は50年代と60年代、2つ目は80年代と90年代、3つ目は10年前に始まり、2016年から注目を集めています(AlphaGo)。
このAIの波の何が特別なのですか?
  • このAIの波は、ディープラーニングの成長と人気によって推進されています。
  • ディープラーニング技術は60年代から存在していましたが、必要なコンピューティング能力とデータは、ここ数年まで大量の商用アプリケーションをサポートするのに十分なほど進歩していませんでした。
  • ディープラーニングが非常にエキサイティングな理由は、簡単に言えば、ディープラーニングは他の学習アルゴリズムよりもはるかに強力なパフォーマンスを可能にするためです。
成功するAIアプリケーションの主要コンポーネント。
  • AIアプリケーションは、明確に定義された(特定の)望ましい(緊急で明確な顧客の問題点を対象とする)問題を解決する必要があります。 顔認識、機械翻訳、自動運転車、検索エンジン最適化はすべて、明確に定義された望ましい問題です。 しかし、明確に定義された望ましい問題がないため、たとえば一般的な掃除ロボットを製造することは困難です。
  • 機械学習アルゴリズムでは、クリーンで適切にラベル付けされたデータにアクセスする必要があります。 このデータ収集の演習は、開発している商用アプリケーションに応じて、困難または簡単になる可能性があります。
  • AIビジネスは、堅牢でスケーラブルなアルゴリズムを開発する必要があります。 これを実現するには、3つの必須要素があります。適切にラベル付けされた大量のデータ、適切な人材、およびディープラーニングが問題を解決するための正しいテクノロジーであるという自信です。
  • AIアプリケーションを成功させるには、多くの計算能力が必要です。 人工知能アルゴリズム(深層学習ニューラルネットワークなど)が高度であるほど、より多くの計算能力が必要になり、手元の操作にコストがかかります。

過去数年にわたって、世界は人工知能(AI)を取り巻く関心の爆発を目撃してきました。 かつては主にSFのジャンルに限定されていた概念であった、AIは私たちの日常生活の一部になりました。 ニュースでいつも読んでいて、アップタウン・ファンクの曲に合わせて踊っている恐ろしいロボットのビデオを見て、AIアプリケーションが私たちの日常生活の中で最も予想外の領域に忍び寄っている様子を聞いています。 しかし、それは誇大広告ですか?

かもしれない。 Gartnerの新興技術の誇大宣伝サイクルによると、AI PaaS(サービスとしてのプラットフォーム)、人工知能、自律運転、ディープラーニングなどの民主化されたAIトレンドはすべて曲線のさまざまなポイントにあり、ディープニューラルネットはピークにあります膨らんだ期待。 しかし、私たちはすでに毎日AIの恩恵を受けています。 SiriからCortana、Alexaまで、スマートアシスタントと会話できるようになりました。 GoogleのAIを利用した検索エンジンからInstagramのフィルターまで、私たちは今、私たちのニーズにすばやく、より関連性のある応答をするという便利さを楽しんでいます。 AIの革新が盛んな中国では、Face ++の顔認識テクノロジーなどの企業が銀行のインスタントID認証を強化し、TikTokなどのアプリが数百万人のティーンエイジャーに短い動画をプッシュしています(実際、そうすることでかなりの論争を呼んでいます)。

2018年の新興技術の誇大宣伝サイクルを示すグラフ。

個人的には、誇大宣伝された期待やビジネスは確かにありますが、 AIは未来であると信じています。 私は、テクノロジー革命に参加するこの一生に一度の機会を捉えるために、独自の初期段階のAIスタートアップを設立しました。 元ベンチャーキャピタルの投資家として、私は常にAIへの投資機会を探しています。 したがって、私は、宇宙を取り巻く否定できない騒音にもかかわらず、AI投資の大幅な急増も正当化されると信じています。

しかし、これを念頭に置いて、特に投資コミュニティの間で、理解にまだ大きなギャップがあることに私は驚いています。 投資家は仕事にお金をかけることに熱心ですが、私の意見では、この分野で効果的な投資家になるために必要な重要な基本的な知識が不足していることがよくあります。 したがって、この記事の目的は、このエキサイティングな分野への投資に関心のある人々に役立つコンテキストと情報を共有して提供することです。 目前のトピックの幅を考慮して、私は自分の考えを2つの部分に分けました。最初の部分は、AIの旅を始めるために知っておく必要のあるいくつかの重要な要素(101種類)について説明することを目的としています。 このシリーズの第2部では、より実用的であり、AI投資を評価する方法とさまざまな投資方法のトピックをさらに深く掘り下げます。

注意:この投稿は技術的なものではありません。 それは投資家とより広い金融コミュニティ、したがって非技術的な読者を対象としています。

AIとは何ですか?

AIには実際には多くの定義があるので、それを定義するように求められたとき、私はしばしば古き良きWikipediaをデフォルトにします。これは、技術者以外の読者にとっては、満足のいく定義を提供すると思います。

人工知能(AI)は、機械知能と呼ばれることもあり、人間や他の動物によって表示される自然知能とは対照的に、機械によって示される知能です。

言い換えれば、非自然な知性は、それがどのように達成されたかに関係なく、「人工」知性です。 AIを実現するために使用される手法には、if-thenルール、ロジック、決定木、回帰、および深層学習を含む機械学習が含まれます。 AIがどのように機能するかを説明するための、私のお気に入りの楽しいツールの1つは、コンピューターがスーパーマリオのプレイ方法を学習する方法についてのこのビデオです。

AIについて話すときは、AI、機械学習、ディープラーニングという3つの重要な用語を必ず耳にします。 それらは同じ意味で使用されることもありますが、異なります。 簡単に言えば、機械学習はAIで使用される技術のサブセットです。 ディープラーニングは、機械学習で使用される手法のサブセットです

Nvidiaブログは、3つの用語間の関係を要約するという素晴らしい仕事をしています。 また、AI開発の3つの波の便利な概要も提供します。 AIの最初の波は50年代と60年代にあり、IBM701がチェッカーマスターのRobertNealeyに勝ったときなどの最初の主要なマイルストーンのいくつかを見ました。 80年代と90年代に、ディープブルーはチェスで人間のマスターカスパロフを打ち負かしました。 2016年3月、AlphaGoは#1のGoプレーヤーであるLeeSedolを打ち負かしました。 AIがゲームで人間のマスターを打ち負かすたびに、AIの新たな誇大宣伝の舞台が生まれました。 その後、テクノロジーが一般の期待に応えるアプリケーションを提供できなかったため、AIの誇大宣伝は、投資と研究助成金の減少により、AIの冬に変わりました。

AI開発のさまざまなフェーズを示す図。

前述のように、機械学習はAIのサブセットです。 Nvidiaによると、最も基本的な機械学習は、「アルゴリズムを使用してデータを解析し、そこから学習してから、世界の何かについて決定または予測することです。 したがって、特定のタスクを実行するための特定の命令セットを使用してソフトウェアルーチンを手動でコーディングするのではなく、マシンは、タスクの実行方法を学習する機能を提供する大量のデータとアルゴリズムを使用して「トレーニング」されます。」 機械学習の非常に一般的な例は、スパムフィルターです。 Googleのスパムフィルターは、「Prince」、「Nigeria」、「luxurywatch」などのトリガーワードを識別することでスパムを認識できます。 また、ユーザーによるスパムの手動分類から「学習」し続けることもできます。 たとえば、「この独占的な抗がん剤を次の銀行口座に送るために$ 1000を送ってください」というメッセージが記載されたメールは、Googleのスパムフィルターで見逃されていました。 ユーザーがスパムとしてラベルを付けると、Gmailはその特定のメールのすべてのキーワードを分析し、「$ 1000」、「drug」、「bankaccount」の組み合わせの単語を含むメールを今後スパムとして扱うことを「学習」します。 回帰、ロジスティクス、ベイジアンネットワーク、クラスタリングなど、機械学習を行うために専門家が採用している多くの数学モデルがあります。

このAIの波の何が特別なのですか?

このAIの波は、ディープラーニングの人気によって推進されています。 機械学習のサブセットとして、ディープラーニングは最近発明されていません。 実際、ウィキペディアによると、「教師あり、深層、フィードフォワード、多層パーセプトロンの最初の一般的な実用的な学習アルゴリズムは、1965年にAlexeyIvakhnenkoとLapaによって公開されました」。 ただし、コンピューティング能力とデータはディープラーニング技術の大規模な商用アプリケーションをサポートするのに十分に進歩していなかったため、ジェフリーヒントンらが独創的な論文「ディープビリーフのための高速学習アルゴリズム」を発表した2006年まで人気を博しませんでした。ネット。」 90年代と2000年代前半のAIの冬にもかかわらず、ディープラーニングの3人の学者、ジェフリーヒントン、ヤンルカン、ヨシュアベンジオを含む数人の学者が、アカデミック分野でディープラーニングに取り組み続けています。 クラウドコンピューティングやGPUなどのコンピューティング能力の急速な進歩と、デジタルエコノミーによるビッグデータの可用性により、過去10年間でディープラーニングアルゴリズムを実装できるようになりました。 たとえば、Googleの自動運転車の研究は2009年に始まりました。

技術的に言えば、深層学習は「次のような機械学習アルゴリズムのクラス」と定義できます。

  • 特徴抽出と変換には、非線形処理ユニットの複数のレイヤーのカスケードを使用します。 連続する各レイヤーは、前のレイヤーからの出力を入力として使用します。
  • 教師あり(例:分類)および/または教師なし(例:パターン分析)の方法で学習します。
  • さまざまなレベルの抽象化に対応する複数のレベルの表現を学習します。 レベルは概念の階層を形成します。」

重要なのは、従来の機械学習と比較して、「複数のレイヤー」です。 たとえば、猫と犬をどのように区別しますか? 機械学習を使用する場合は、犬と猫の両方に共通するいくつかの特徴を抽出できます。たとえば、両耳、毛皮のような顔、目と鼻と口の間の距離などです。次のような結果が得られる場合があります。写真は50%が犬、50%が猫です-あまり役に立ちません。 ただし、ディープラーニングを使用すると、猫と犬の特徴が何であるかさえわかりませんが、マシンは、新しい機能と数百(または数千)の統計モデルを作成する複数のレイヤーを介して、より多くの機能を提供します。正確な出力-たとえば、90%の犬、10%の猫。 以下の2つのグラフは、ニューラルネットワークがどのように「学習」するか、および従来の機械学習とニューラルネットワークの違いを示しています。

ニューラルネットワークがどのように学習するか、および従来の機械学習とニューラルネットワークの違いを示すチャート。

読者は、上記を読んだ後、頭をかいてしまうかもしれません。 しかし、本来の目的に戻ります。投資家の観点から、ディープラーニングの何が特別なのですか。 この質問には、さらに複雑なさまざまな技術的説明で答えることができますが、実際には、左下のグラフは、それを明確にするための優れた役割を果たします。ディープラーニングは、他の学習アルゴリズムよりもはるかに強力なパフォーマンスを可能にします。 Microsoftのブログ(右下のグラフ)で詳しく説明されている音声認識の例を見てみましょう。元の1988年の音声認識エラー率は60〜70%でしたが、ディープラーニングを使用する新しいMicrosoftシステムは2014年にはわずか6.3%でした。

ディープラーニングと音声認識の単語誤り率の歴史的進歩に関するデータを示す2つのグラフの画像。

成功するAIアプリケーションの主要コンポーネント

機械学習(ディープラーニングを含む)製品の成功には、明確に定義された望ましい問題、データ、アルゴリズム、および計算能力という4つの重要な要素があると思います。

何よりもまず、AIアプリケーションは、明確に定義された(具体的な)望ましい(緊急かつ明確な顧客の問題点を対象とする)問題を解決する必要があります。 コンピューターがAIの3つの異なる波(チェッカー、チェス、囲碁)でプレイするように教えられたさまざまなゲームについて考えてみてください。 それらは非常に明確に定義された問題であり、したがってコンピューターが解決するのは簡単でした。 顔認識、機械翻訳、自動運転車、検索エンジン最適化はすべて、明確に定義された望ましい問題です。 しかし、明確に定義された望ましい問題がないため、たとえば一般的な家の掃除ロボットを製造するのは非常に困難です。 カップを集めたり、洗濯物をかごに入れたりするなどの簡単な家庭の仕事では、あまりにも多くの問題を解決する必要があります。 たとえば、どのオブジェクトを拾う必要があるか(カップ、汚れた洗濯物、きれいな洗濯物ではないなど)、どこに行くか、そこに行く方法(家庭内の障害物を避けて目的の場所に移動する)を特定する必要があります。場所)、カップや洗濯物などを壊さないように、各オブジェクトを必要な力で処理します。

次に、機械学習アルゴリズムを開発するには、クリーンで適切にラベル付けされたデータにアクセスする必要があります。 これは、これらのアルゴリズムが、必要な予測関係を確立するために、さまざまな統計モデルに適切にラベル付けされた大量のデータを供給することによって構築されているためです。 このデータ収集の演習は、開発している商用アプリケーションに応じて、困難または簡単になる可能性があります。 たとえば、ワイン用ブドウ畑のコンピュータービジョンアルゴリズムを開発するために必要なデータを収集するために、私のスタートアップは、さまざまな場所から、さまざまな品種、さらに難しい、さまざまな季節の畑の画像を必要としていました。 毎シーズン1年で、満足のいく商品を手に入れるには何年もかかります。 対照的に、中国で優れた顔認識アルゴリズムを開発したい場合、たとえば1,000万枚の画像を収集するには、北京のにぎやかな通りにカメラを1週間設置するだけで、タスクが完了します。 もう1つの例は、中国でナンバーワンのAIを活用したパーソナライズされたニュースアグリゲーターであるToutiaoです。これは、個人的なニュースの好みについて学習し、最も関連性の高いニュースのみを表示します。 この場合も、データの収集がはるかに簡単になります。たとえば、各ニュースカテゴリで読んだ記事の数、各記事に費やした時間などです。

第三に、AIビジネスは堅牢でスケーラブルなアルゴリズムを開発する必要があります。 これを実現するには、3つの必須要素があります。1つは、適切にラベル付けされた大量のデータ(上記で説明)、適切な人材、そしてディープラーニングが問題を解決するための正しいテクノロジーであるという自信です。 AIビジネスには、必要なアルゴリズムを開発するための適切な人材が必要ですが、これらは高度に専門化されており、高価であり、不足しています。 たとえば、スタートアップの採用を検討しているときに、少なくとも、アルゴリズムプロトタイプを開発するためのデータサイエンティスト(通常はPhD)、フレームワークを設計するためのエンジニア、コーディングするためのプログラマー(TensorFlow、Python、C ++など)が必要であることに気付きました。スケーラブルなプログラムに、そしてそれらをまとめる人々(プロダクトマネージャー、UX、UIなど)。

もう1つの考慮事項は、計算能力です。 なんで? 深層学習ニューラルネットワークは、他のAI手法よりもはるかに多くの計算を必要とするためです。 たとえば、画像内の犬を識別する同じタスクの場合、非深層学習アルゴリズムを使用してモデルをトレーニングするには、たとえば、1GBのデータセットが与えられた場合に10個の統計モデルが必要になる場合があります。 ディープニューラルネットワークモデルには、たとえば、100GBのデータセットを実行する1000の統計モデルが必要になる場合があります。 ネットワークを使用すると結果は良くなりますが、必要な計算能力ははるかに大きくなります。 その結果、これらのモデルには1台のコンピューター(パーソナルコンピューターで行う場合のように)だけでなく、各GPUが計算の5%を処理する分散コンピューティングが必要になるため、20個のGPUを合わせて必要な計算量を処理できます。 つまり、独自のGPUクラスターサーバーを構築するか、AWSなどのプラットフォームからコンピューティングパワーを借りる必要があります。 クラウドコンピューティングまたは独自のサーバーからのコンピューティング能力はコストがかかりますが、公平を期すために、コンピューティングの単位コストは継続的に減少するはずです(ムーアの法則による)。

結論

多くの業界や消費者向けインターネットのデジタル化により、意図的に収集され、整理された大量のデジタルデータが利用できるようになるため、多くの人がAIの飛躍的進歩とスタートアップを見るのに最適な時期だと信じています。 NvidiaのGPUとIntelのFPGAの開発により、必要な計算を実行するのがはるかに安価で高速になりました。 したがって、現在のAIの革新の波は、ディープラーニングの重要な進歩によって推進されています。

しかし、AIアプリケーションを成功させるには、明確に定義された望ましい問題、データ、アルゴリズム、およびかなりの計算能力が必要です。 AIを使用してビジネスを強化することを検討しているこの記事を読んでいる経営幹部には、上記の4つの主要な要素も当てはまります。

AIについてもっと知るにはどうすればよいですか? AIについて学ぶための本、セミナー、Courseraコース、研究論文、ディープラーニングなどの組織がたくさんあります。 この記事の焦点はAIの基本を知りたい投資家を対象としているため、脅威としてのAIの可能性、業界の将来の見通し、AI投資、プロなど、AIに関する話題のトピックの多くには触れませんでした。さまざまなアルゴリズム(CNNなど)、プロトタイピングとスケーリング、主要なプログラミング言語などの短所。このシリーズのパート2では、投資家の観点からAI企業を評価する方法について詳しく説明します。