Руководство по инвестициям в ИИ: закладываем основу (часть I)

Опубликовано: 2022-03-11

Управляющее резюме

Что такое ИИ?

Искусственный интеллект (ИИ) можно просто объяснить как интеллект, демонстрируемый машинами, в отличие от естественного интеллекта, демонстрируемого людьми и другими животными.
Машинное обучение — это подмножество методов, используемых в ИИ, а глубокое обучение — это подмножество методов, используемых в машинном обучении.
Было три значительных волны развития ИИ. Первая в 50-х и 60-х годах, вторая в 80-х и 90-х годах, а третья началась десять лет назад и приобрела известность с 2016 года (AlphaGo).

Что особенного в этой волне ИИ?

Эта волна искусственного интеллекта обусловлена ростом и популярностью глубокого обучения.
Хотя методы глубокого обучения существуют с 60-х годов, требуемая вычислительная мощность и данные не были достаточно развиты для поддержки массового коммерческого применения до последних нескольких лет.
Причина, по которой глубокое обучение настолько увлекательно, заключается в том, что, проще говоря, глубокое обучение обеспечивает гораздо более высокую производительность, чем другие алгоритмы обучения.

Ключевые компоненты успешных приложений ИИ.

Приложения ИИ должны решать четко определенную (конкретную) и желательную (нацеленную на неотложные и четкие болевые точки клиента) проблему. Распознавание лиц, машинный перевод, беспилотные автомобили, поисковая оптимизация — все это четко определенные желательные проблемы. Однако из-за отсутствия четко определенных желательных задач трудно создать, например, обычного робота для уборки дома.
Алгоритмы машинного обучения требуют доступа к чистым и хорошо размеченным данным. Это упражнение по сбору данных может быть сложным или простым, в зависимости от того, какое коммерческое приложение вы разрабатываете.
Бизнес ИИ должен разрабатывать надежные и масштабируемые алгоритмы. Для этого необходимы три обязательных условия: большой объем хорошо размеченных данных, правильный талант и уверенность в том, что глубокое обучение — это правильная технология для решения проблемы.
Успешные приложения ИИ требуют большой вычислительной мощности. Чем более совершенен алгоритм искусственного интеллекта (например, нейронные сети с глубоким обучением), тем больше вычислительной мощности требуется, тем дороже операция.

За последние несколько лет мир стал свидетелем взрыва интереса к искусственному интеллекту (ИИ). Концепция ИИ, которая когда-то ограничивалась в основном жанром научной фантастики, стала частью нашей повседневной жизни. Мы постоянно читаем об этом в новостях, смотрим видео страшных роботов, танцующих под мотив Uptown Funk , и слышим о том, как приложения ИИ проникают даже в самые неожиданные сферы нашей повседневной жизни. Но разве это хайп?

Возможно. Согласно отчету Gartner Hype Cycle for Emerging Technologies, тенденции демократизации ИИ, включая AI PaaS (платформа как услуга), общий искусственный интеллект, автономное вождение, глубокое обучение, находятся в разных точках кривой, а глубокие нейронные сети находятся на пике популярности. завышенные ожидания. Тем не менее, мы уже каждый день извлекаем пользу из ИИ. От Siri до Cortana и Alexa теперь мы можем общаться с умными помощниками. От поисковой системы Google с искусственным интеллектом до фильтров Instagram — теперь мы наслаждаемся удобством быстрых и более релевантных ответов на наши потребности. В Китае, где процветают инновации в области искусственного интеллекта, такие компании, как технология распознавания лиц Face++, обеспечивают мгновенную идентификацию личности для банков, в то время как приложения, такие как TikTok, продвигают короткие видеоролики для миллионов подростков (фактически вызывая серьезные споры при этом).

График, показывающий цикл ажиотажа перед новыми технологиями в 2018 году.

Лично я считаю, что, несмотря на некоторые завышенные ожидания и бизнес, будущее за ИИ . Я основал свой собственный стартап ИИ на ранней стадии, чтобы воспользоваться этой выпадающей раз в жизни возможностью поучаствовать в технологической революции. Как бывший венчурный инвестор, я также постоянно ищу возможности для инвестиций в ИИ. Поэтому я считаю, что, несмотря на неоспоримый шум, окружающий космос, огромный всплеск инвестиций в ИИ также оправдан.

Но с учетом этого меня удивляет, что, особенно среди инвестиционного сообщества, все еще существует большой пробел в понимании. Инвесторы стремятся заставить деньги работать, но им часто не хватает важных базовых знаний, которые, на мой взгляд, необходимы для эффективного инвестирования в этой области. Таким образом, цель этой статьи состоит в том, чтобы поделиться и предоставить полезный контекст и информацию для тех, кто заинтересован в инвестировании в эту захватывающую область. Учитывая широту обсуждаемой темы, я разделил свои мысли на две части, первая из которых была направлена на обсуждение нескольких основных элементов, которые необходимо знать, чтобы начать путешествие по ИИ — своего рода 101. Вторая часть этой серии статей будет более практической и более подробно расскажет о том, как оценивать инвестиции в ИИ и о различных способах инвестирования.

NB Этот пост не является техническим. Он предназначен для инвесторов и более широкого финансового сообщества и, следовательно, нетехнических читателей.

Что такое ИИ?

На самом деле существует много определений ИИ, поэтому, когда меня просят дать ему определение, я часто по умолчанию использую старую добрую Википедию, которая, как мне кажется, для нетехнической аудитории дает удовлетворительное определение:

Искусственный интеллект (ИИ), иногда называемый машинным интеллектом, представляет собой интеллект, демонстрируемый машинами, в отличие от естественного интеллекта, демонстрируемого людьми и другими животными.

Другими словами, любой неестественный интеллект является «искусственным» интеллектом, независимо от того, как он достигается. Методы, используемые для достижения ИИ, включают правила «если-то», логику, деревья решений, регрессии и машинное обучение, включая глубокое обучение. Один из моих любимых и забавных инструментов для объяснения того, как работает ИИ, — это видео о том, как компьютер учится играть в Super Mario.

Говоря об ИИ, вы неизменно будете слышать эти три ключевых термина: ИИ, машинное обучение и глубокое обучение. Иногда они используются взаимозаменяемо, но они разные. Проще говоря, машинное обучение — это подмножество методов, используемых в ИИ. Глубокое обучение — это подмножество методов, используемых в машинном обучении .

Блог Nvidia хорошо резюмирует взаимосвязь между тремя терминами. Он также предоставляет удобный обзор трех волн развития ИИ. Первая волна ИИ пришлась на 50-е и 60-е годы и ознаменовалась одними из первых важных вех, например, когда IBM 701 выиграл игру в шашки над мастером шашек Робертом Нили. В 80-х и 90-х годах Deep Blue обыграл в шахматы человеческого мастера Каспарова. В марте 2016 года AlphaGo обыграла игрока №1 в го Ли Седоля. Каждый раз, когда ИИ побеждал мастеров-людей в играх, это вызывало новую волну ажиотажа вокруг ИИ. Затем, поскольку технология не могла предоставить приложения, отвечающие ожиданиям общественности, шумиха вокруг ИИ превратилась бы в зиму ИИ с сокращением инвестиций и грантов на исследования.

Графика, показывающая различные этапы развития ИИ.

Как упоминалось ранее, машинное обучение является подмножеством ИИ. Согласно Nvidia, машинное обучение в своей основе — это «практика использования алгоритмов для анализа данных, извлечения уроков из них, а затем определения или прогнозирования чего-либо в мире. Таким образом, вместо того, чтобы вручную кодировать программные процедуры с определенным набором инструкций для выполнения конкретной задачи, машина «обучается» с использованием больших объемов данных и алгоритмов, которые дают ей возможность научиться выполнять задачу». Очень распространенным примером машинного обучения является спам-фильтр. Спам-фильтр Google может распознавать спам, определяя триггерные слова, такие как «принц», «Нигерия» и «роскошные часы». Он также может продолжать «учиться» на пользовательской классификации спама. Например, электронное письмо с сообщением «отправьте 1000 долларов, чтобы получить это эксклюзивное лекарство от рака на следующий банковский счет» было пропущено спам-фильтром Google. Как только пользователь помечает письмо как спам, Gmail анализирует все ключевые слова в этом конкретном письме и «учится» обрабатывать электронные письма, содержащие сочетания слов «1000 долларов США», «наркотик» и «банковский счет», как спам в будущем. Существует множество математических моделей, используемых профессионалами для машинного обучения, например, регрессии, логистика, байесовские сети, кластеризация.

Что особенного в этой волне ИИ?

Эта волна искусственного интеллекта вызвана популярностью глубокого обучения . Как подмножество машинного обучения, глубокое обучение было изобретено не так давно. На самом деле, согласно Википедии, «первый общий рабочий алгоритм обучения для контролируемых, глубоких, многослойных персептронов с прямой связью был опубликован Алексеем Ивахненко и Лапой в 1965 году». Однако, поскольку вычислительная мощность и данные не были достаточно развиты для поддержки массового коммерческого применения методов глубокого обучения, они не пользовались популярностью до 2006 года, когда Джеффри Хинтон и др. опубликовали свою основополагающую статью «Алгоритм быстрого обучения для глубокого убеждения». сети». Несмотря на зиму ИИ 90-х и первую половину 2000-х, несколько ученых, в том числе три академических гуру глубокого обучения, Джеффри Хинтон, Янн ЛеКун и Йошуа Бенжио, продолжают работать над глубоким обучением в академической сфере. Быстрый прорыв вычислительной мощности, например, облачных вычислений и графических процессоров, в сочетании с доступностью больших данных благодаря цифровой экономике, сделал возможным внедрение алгоритмов глубокого обучения в последнее десятилетие. Например, исследование беспилотных автомобилей Google началось в 2009 году.

С технической точки зрения глубокое обучение можно определить как «класс алгоритмов машинного обучения, которые:

используйте каскад из нескольких уровней нелинейных процессоров для извлечения и преобразования признаков. Каждый последующий слой использует выходные данные предыдущего слоя в качестве входных данных.
учиться под наблюдением (например, классификация) и/или неконтролируемым (например, анализ паттернов) образом.
изучить несколько уровней представлений, соответствующих разным уровням абстракции; уровни образуют иерархию понятий».

Ключевым моментом является «многоуровневость» по сравнению с традиционным машинным обучением. Например, как бы вы отличили кошку от собаки? Если бы вы использовали машинное обучение, вы могли бы выделить несколько признаков, общих для собак и кошек, таких как два уха, пушистая морда, расстояние между глазами, носом и ртом и т. д. И вы могли бы получить результат, говорящий на картинке 50% собака, 50% кошка - не очень полезно. Однако, используя глубокое обучение, вы даже не знаете, в чем заключаются отличительные черты кошки и собаки, но машина, благодаря многоуровневому созданию новых функций и сотням (или тысячам) статистических моделей, предоставит более подробную информацию. точный вывод - например, 90% собака, 10% кошка. Две диаграммы ниже иллюстрируют, как нейронная сеть «обучается», и разницу между классическим машинным обучением и нейронными сетями.

Диаграммы, иллюстрирующие процесс обучения нейронной сети и разницу между классическим машинным обучением и нейронными сетями.

Читатели могут почесать затылок после прочтения вышеизложенного, и это правильно. Но вернемся к нашей первоначальной цели: с точки зрения инвестора, что такого особенного в глубоком обучении? Можно было бы ответить на этот вопрос с помощью различных дополнительных сложных технических объяснений, но на самом деле просто говоря, график ниже слева делает большую работу, чтобы сделать его действительно ясным: глубокое обучение обеспечивает гораздо более высокую производительность, чем другие алгоритмы обучения. Возьмем пример распознавания речи, подробно описанный в блоге Microsoft (диаграмма ниже справа): первоначальный уровень ошибок распознавания речи в 1988 году составлял 60-70%, в то время как новая система Microsoft, использующая глубокое обучение, составляла всего 6,3% в 2014 году.

Изображение с двумя графиками, показывающими данные о глубоком обучении и историческом прогрессе частоты ошибок при распознавании речи.

Ключевые компоненты успешных приложений ИИ

Я считаю , что есть 4 ключевых компонента успеха продукта машинного обучения (включая глубокое обучение): четко определенные желаемые проблемы, данные, алгоритм(ы) и вычислительная мощность .

Прежде всего, приложение ИИ должно решать четко определенную (конкретную) и желательную (нацеленную на неотложные и четкие болевые точки клиента) проблему . Подумайте о разных играх, в которые компьютер научили играть на трех разных волнах ИИ: шашки, шахматы, го. Это были очень четко определенные проблемы, и поэтому компьютеру было легче их решить. Распознавание лиц, машинный перевод, беспилотные автомобили, поисковая оптимизация — все это четко определенные желательные проблемы. Однако отсутствие четко определенных желательных задач является причиной того, что так сложно создать, например, робота для уборки дома. Простые бытовые задачи, например, сбор чашек и складывание белья в корзину, требуют решения слишком многих проблем. Например, требуется, чтобы машина определяла, какие предметы нужно подобрать (чашки, грязное и нечистое белье и т. д.), куда и как идти (обходить препятствия в доме и добираться до нужного места). местоположение), манипулируя каждым предметом с нужной силой, чтобы он не разбил чашку, белье и т. д.

Во-вторых, для разработки алгоритма машинного обучения требуется доступ к чистым и хорошо размеченным данным . Это связано с тем, что эти алгоритмы строятся путем подачи в различные статистические модели большого количества хорошо размеченных данных для установления необходимых прогностических взаимосвязей. Это упражнение по сбору данных может быть сложным или простым, в зависимости от того, какое коммерческое приложение вы разрабатываете. Например, для сбора необходимых данных, необходимых для разработки алгоритма компьютерного зрения для виноградных полей, моему стартапу нужны были изображения полей из разных мест с разными сортами и, что еще сложнее, — с разными сезонами. Поскольку каждый сезон длится один год, потребуются годы, чтобы получить удовлетворительные продукты. Напротив, если вы хотите разработать хороший алгоритм распознавания лиц в Китае, чтобы собрать, например, 10 миллионов изображений, вам просто нужно установить камеру на оживленной улице в Пекине на неделю, и задача будет выполнена. Другим примером может служить агрегатор персонализированных новостей №1 на базе искусственного интеллекта в Китае, Toutiao, который узнает о ваших личных новостных предпочтениях и показывает вам только самые актуальные новости. Сбор данных в этом случае снова намного проще, например, количество статей, которые вы читаете в каждой категории новостей, количество времени, которое вы тратите на каждую статью, и т. д.

В-третьих, ИИ-бизнесу необходимо разработать надежные и масштабируемые алгоритмы . Для этого необходимы три условия: большой объем хорошо размеченных данных (как обсуждалось выше), правильный талант и уверенность в том, что глубокое обучение — это правильная технология для решения проблемы. Для разработки необходимых алгоритмов бизнесу в области искусственного интеллекта нужны таланты, но они узкоспециальны, дороги и дефицитны. Например, когда я искал сотрудников для своего стартапа, я обнаружил, что мне нужны как минимум специалисты по данным (обычно с докторской степенью) для разработки прототипов алгоритмов, инженеры для разработки фреймворков, программисты (TensorFlow, Python, C++ и т. д.) для написания кода. в масштабируемые программы и людей, которые их объединяют (менеджер по продукту, UX, UI и т. д.).

Еще одним соображением является вычислительная мощность . Почему? Потому что нейронные сети глубокого обучения требуют гораздо больше вычислений, чем другие методы ИИ. Например, для той же задачи идентификации собаки на изображении для обучения модели с использованием алгоритма неглубокого обучения может потребоваться, скажем, 10 статистических моделей с набором данных объемом 1 ГБ. Для модели глубоких нейронных сетей может потребоваться, скажем, 1000 статистических моделей, обрабатывающих набор данных объемом 100 ГБ. Результаты лучше при использовании сетей, но требуемая вычислительная мощность намного больше. В результате для этих моделей требуется не один компьютер (как мы делаем на нашем персональном компьютере), а распределенные вычисления, при которых каждый графический процессор обрабатывает, скажем, 5% вычислений, так что 20 графических процессоров вместе могут справиться с требуемым вычислительным объемом. Это, в свою очередь, означает необходимость создания собственных кластерных серверов графических процессоров или аренду вычислительной мощности у таких платформ, как AWS. Вычислительная мощность облачных вычислений или ваших собственных серверов стоит дорого, хотя, справедливости ради, удельная стоимость вычислений должна постоянно снижаться (согласно закону Мура).

Заключение

Многие считают, что сейчас самое подходящее время, чтобы увидеть прорывы и стартапы в области ИИ, потому что цифровизация многих отраслей и потребительского интернета делает доступным большой объем целенаправленно собранных, четко организованных цифровых данных. Развитие графического процессора Nvidia и FPGA Intel значительно удешевляет и ускоряет проведение необходимых вычислений. Таким образом, текущая волна инноваций в области искусственного интеллекта обусловлена важными достижениями в области глубокого обучения .

Но чтобы приложение ИИ было успешным, нужна четко определенная желаемая задача, данные, алгоритм и значительная вычислительная мощность. Для руководителей, читающих эту статью, которые рассматривают возможность использования ИИ для расширения возможностей своего бизнеса, также применимы четыре ключевых компонента, упомянутых выше.

Как узнать больше об ИИ? Существует множество книг, семинаров, курсов Coursera, исследовательских работ и организаций, таких как Deep Learning, для изучения ИИ. Поскольку эта статья предназначена для инвесторов, которые хотят знать основы ИИ, я не затронул многие горячие темы ИИ, такие как потенциал ИИ как угрозы, перспективы отрасли на будущее, инвестиции в ИИ, преимущества и минусы различных алгоритмов (например, CNN), прототипирование и масштабирование, основные языки программирования и т. д. Во второй части этой серии я расскажу, как оценивать компании ИИ с точки зрения инвестора.