Introducción a la inversión en IA: Sentar las bases (Parte I)
Publicado: 2022-03-11Resumen ejecutivo
¿Qué es la IA?
- La inteligencia artificial (IA) puede explicarse simplemente como la inteligencia demostrada por las máquinas, en contraste con la inteligencia natural que muestran los humanos y otros animales.
- El aprendizaje automático es un subconjunto de técnicas utilizadas en IA, y el aprendizaje profundo es un subconjunto de técnicas utilizadas en aprendizaje automático.
- Ha habido tres olas significativas de desarrollo de IA. El primero en los años 50 y 60, el segundo en los 80 y 90, y el tercero comenzó hace una década y ha ganado protagonismo desde 2016 (AlphaGo).
¿Qué tiene de especial esta ola de IA?
- Esta ola de IA está impulsada por el crecimiento y la popularidad del aprendizaje profundo.
- Si bien las técnicas de aprendizaje profundo han existido desde los años 60, la potencia informática y los datos requeridos no eran lo suficientemente avanzados para admitir aplicaciones comerciales masivas hasta los últimos años.
- La razón por la que el aprendizaje profundo es tan emocionante es que, en pocas palabras, el aprendizaje profundo permite un rendimiento mucho más potente que otros algoritmos de aprendizaje.
Componentes clave de aplicaciones exitosas de IA.
- Las aplicaciones de IA deben resolver un problema bien definido (específico) y deseable (dirigiéndose a los puntos críticos urgentes y claros del cliente). El reconocimiento facial, la traducción automática, los automóviles sin conductor, la optimización de motores de búsqueda son problemas deseables bien definidos. Sin embargo, la falta de problemas deseables bien definidos es la razón por la cual es difícil producir, por ejemplo, un robot de limpieza general de la casa.
- Los algoritmos de aprendizaje automático requieren acceso a datos limpios y bien etiquetados. Este ejercicio de recopilación de datos puede ser difícil o fácil, según la aplicación comercial que esté desarrollando.
- Una empresa de IA necesita desarrollar algoritmos robustos y escalables. Para lograr esto, hay tres elementos imprescindibles: una gran cantidad de datos bien etiquetados, el talento adecuado y la confianza de que el aprendizaje profundo es la tecnología correcta para resolver el problema.
- Las aplicaciones exitosas de IA requieren mucha potencia informática. Cuanto más avanzado sea el algoritmo de inteligencia artificial (por ejemplo, redes neuronales de aprendizaje profundo), más poder de cómputo se requiere, más costosa es la operación en cuestión.
En los últimos años, el mundo ha sido testigo de una explosión de interés en torno a la Inteligencia Artificial (IA). Un concepto que antes se limitaba principalmente al género de ciencia ficción, la IA se ha convertido en parte de nuestra vida cotidiana. Leemos sobre esto todo el tiempo en las noticias, vemos videos de robots de aspecto aterrador que bailan al ritmo de Uptown Funk y escuchamos cómo las aplicaciones de IA se están infiltrando incluso en las esferas más inesperadas de nuestra vida cotidiana. ¿Pero es un bombo?
Podría ser. De acuerdo con Hype Cycle for Emerging Technologies de Gartner, las tendencias de IA democratizadas que incluyen AI PaaS (plataforma como servicio), inteligencia general artificial, conducción autónoma, aprendizaje profundo, se encuentran en varios puntos de la curva, con Deep Neural Nets en la cima de expectativas infladas. Sin embargo, también nos estamos beneficiando de la IA todos los días. Desde Siri hasta Cortana y Alexa, ahora podemos conversar con asistentes inteligentes. Desde el motor de búsqueda impulsado por IA de Google hasta los filtros de Instagram, ahora disfrutamos de la comodidad de respuestas rápidas y más relevantes para nuestras necesidades. En China, donde la innovación de la IA está prosperando, empresas como la tecnología de reconocimiento facial de Face++ están impulsando la autenticación de identificación instantánea para los bancos, mientras que aplicaciones como TikTok envían videos cortos a millones de adolescentes (de hecho, provocan una controversia considerable al hacerlo).
Personalmente, creo que aunque ciertamente hay algunas expectativas y negocios exagerados, la IA es el futuro . Fundé mi propia startup de IA en etapa inicial para capturar esta oportunidad única en la vida de participar en la revolución tecnológica. Como ex inversor de capital de riesgo, también busco constantemente oportunidades de inversión en IA. Por lo tanto, creo que, a pesar del innegable ruido que rodea el espacio, el enorme aumento de la inversión en IA también está justificado.
Pero con esto en mente, me sorprende que, particularmente entre la comunidad inversora, todavía hay una gran brecha en la comprensión. Los inversores están dispuestos a poner dinero a trabajar, pero a menudo carecen de importantes conocimientos básicos que, en mi opinión, se requieren para ser un inversor eficaz en este espacio. El propósito de este artículo es, por lo tanto, compartir y proporcionar información y contexto útil para aquellos interesados en invertir en este apasionante campo. Dada la amplitud del tema en cuestión, dividí mis pensamientos en dos partes, la primera destinada a discutir algunos elementos esenciales que uno necesita saber para comenzar el viaje de la IA: una especie de 101. La segunda parte de esta serie será más práctica y profundizará en el tema de cómo evaluar las inversiones en IA y las diferentes formas de invertir.
NB Esta publicación no pretende ser técnica. Está dirigido a inversores y a la comunidad financiera en general y, por lo tanto, a lectores no técnicos.
¿Qué es la IA?
En realidad, hay muchas definiciones de IA, por lo que cuando me piden que la defina, a menudo uso por defecto la antigua Wikipedia, que, para audiencias no técnicas, creo que proporciona una definición satisfactoria:
La inteligencia artificial (IA), a veces llamada inteligencia artificial, es la inteligencia demostrada por las máquinas, en contraste con la inteligencia natural mostrada por los humanos y otros animales.
En otras palabras, cualquier inteligencia no natural es inteligencia “artificial”, independientemente de cómo se logre. Las técnicas utilizadas para lograr la IA incluyen reglas si-entonces, lógica, árboles de decisión, regresiones y aprendizaje automático, incluido el aprendizaje profundo. Una de mis herramientas favoritas y divertidas para explicar cómo funciona la IA es este video sobre cómo una computadora aprende a jugar Super Mario.
Cuando se habla de IA, invariablemente escuchará estos tres términos clave: IA, aprendizaje automático y aprendizaje profundo. A veces se usan indistintamente, pero son diferentes. En pocas palabras, el aprendizaje automático es un subconjunto de técnicas utilizadas en la IA. El aprendizaje profundo es un subconjunto de técnicas utilizadas en el aprendizaje automático .
El blog de Nvidia hace un buen trabajo al resumir la relación entre los tres términos. También proporciona una descripción general útil de las tres oleadas de desarrollo de la IA. La primera ola de IA fue en los años 50 y 60 y vio algunos de los primeros hitos importantes, como cuando el IBM 701 ganó el juego de damas sobre el maestro de las damas Robert Nealey. En los años 80 y 90, Deep Blue venció al maestro humano Kasparov en ajedrez. En marzo de 2016, AlphaGo venció al jugador de Go número 1, Lee Sedol. Cada vez que la IA derrotó a los maestros humanos en los juegos, provocó una nueva etapa de entusiasmo por la IA. Luego, como la tecnología no pudo ofrecer aplicaciones que cumplieran con las expectativas del público, la exageración de la IA se convertiría en un invierno de IA, con inversiones y subvenciones para investigación reducidas.
Como se mencionó anteriormente, el aprendizaje automático es un subconjunto de la IA. Según Nvidia, el aprendizaje automático en su forma más básica es “la práctica de usar algoritmos para analizar datos, aprender de ellos y luego hacer una determinación o predicción sobre algo en el mundo. Entonces, en lugar de codificar a mano rutinas de software con un conjunto específico de instrucciones para realizar una tarea en particular, la máquina se 'entrena' utilizando grandes cantidades de datos y algoritmos que le dan la capacidad de aprender cómo realizar la tarea". Un ejemplo muy común de aprendizaje automático es el filtro de spam. El filtro de spam de Google puede reconocer el spam al identificar palabras desencadenantes como "Príncipe", "Nigeria" y "reloj de lujo". También puede seguir “aprendiendo” de la clasificación manual de spam de los usuarios. Por ejemplo, el filtro de spam de Google no detectó un correo electrónico con el mensaje "envíe $1000 para obtener este medicamento exclusivo contra el cáncer a la siguiente cuenta bancaria". Una vez que un usuario lo etiqueta como spam, Gmail analiza todas las palabras clave en ese correo electrónico en particular y "aprende" a tratar los correos electrónicos que contienen la combinación de palabras "$1000", "droga" y "cuenta bancaria" como spam en el futuro. Hay muchos modelos matemáticos empleados por profesionales para hacer aprendizaje automático, por ejemplo, regresiones, logística, redes bayesianas, agrupamiento.
¿Qué tiene de especial esta ola de IA?
Esta ola de IA está impulsada por la popularidad del aprendizaje profundo . Como subconjunto del aprendizaje automático, el aprendizaje profundo no se inventó recientemente. De hecho, según Wikipedia, "el primer algoritmo general de aprendizaje de trabajo para perceptrones multicapa supervisados, profundos y avanzados fue publicado por Alexey Ivakhnenko y Lapa en 1965". Sin embargo, como el poder de cómputo y los datos no eran lo suficientemente avanzados para soportar la aplicación comercial masiva de técnicas de aprendizaje profundo, no ganó popularidad hasta 2006 cuando Geoffrey Hinton et al publicaron su artículo seminal, "Un algoritmo de aprendizaje rápido para creencias profundas". Redes. A pesar del invierno de la IA de los 90 y la primera mitad de los 2000, algunos académicos, incluidos los tres gurús académicos del aprendizaje profundo, Geoffrey Hinton, Yann LeCun y Yoshua Bengio, continúan trabajando en el aprendizaje profundo en el campo académico. El rápido avance de la potencia informática, por ejemplo, la computación en la nube y las GPU, junto con la disponibilidad de big data a través de la economía digital, han hecho posible la implementación de algoritmos de aprendizaje profundo en la última década. Por ejemplo, la investigación sobre automóviles autónomos de Google comenzó en 2009.

Técnicamente hablando, el aprendizaje profundo se puede definir como “una clase de algoritmos de aprendizaje automático que:
- Utilice una cascada de múltiples capas de unidades de procesamiento no lineal para la extracción y transformación de características. Cada capa sucesiva utiliza la salida de la capa anterior como entrada.
- aprender de forma supervisada (p. ej., clasificación) y/o no supervisada (p. ej., análisis de patrones).
- aprender múltiples niveles de representaciones que corresponden a diferentes niveles de abstracción; los niveles forman una jerarquía de conceptos.”
La clave es "múltiples capas", en comparación con el aprendizaje automático tradicional. Por ejemplo, ¿cómo distinguirías a un gato de un perro? Si usara el aprendizaje automático, podría extraer algunas características que son comunes tanto para perros como para gatos, como dos orejas, una cara peluda, la distancia entre los ojos, la nariz y la boca, etc. Y podría obtener un resultado diciendo la imagen es 50% perro, 50% gato - no muy útil. Sin embargo, con el aprendizaje profundo, ni siquiera sabe cuáles son las características distintivas de un gato frente a un perro, pero la máquina, a través de múltiples capas de creación de nuevas características y cientos (o miles) de modelos estadísticos, proporcionaría una más salida precisa, por ejemplo, 90 % perro, 10 % gato. Los dos gráficos a continuación ilustran cómo "aprende" una red neuronal y la diferencia entre el aprendizaje automático clásico y las redes neuronales.
Los lectores pueden quedarse rascándose la cabeza después de leer lo anterior, y con razón. Pero volviendo a nuestro propósito original: desde el punto de vista de un inversor, ¿qué tiene de especial el aprendizaje profundo? Se podría responder a esta pregunta con varias explicaciones técnicas más complicadas, pero en pocas palabras, el gráfico a continuación a la izquierda hace un gran trabajo al dejarlo muy claro: el aprendizaje profundo permite un rendimiento mucho más poderoso que otros algoritmos de aprendizaje. Tome el ejemplo del reconocimiento de voz como se detalla en el blog de Microsoft (gráfico a continuación a la derecha): la tasa de error de reconocimiento de voz original de 1988 fue del 60-70 %, mientras que el nuevo sistema de Microsoft que utiliza aprendizaje profundo fue solo del 6,3 % en 2014.
Componentes clave de aplicaciones de IA exitosas
Creo que hay 4 componentes clave para el éxito de un producto de aprendizaje automático (incluido el aprendizaje profundo): problemas deseables bien definidos, datos, algoritmo(s) y poder de cómputo .
En primer lugar, la aplicación de IA debe resolver un problema bien definido (específico) y deseable (dirigido a puntos críticos urgentes y claros del cliente) . Piense en los diferentes juegos que se le enseñó a jugar a la computadora en las 3 oleadas diferentes de IA: damas, ajedrez, Go. Eran problemas muy bien definidos y por lo tanto más fáciles de resolver para una computadora. El reconocimiento facial, la traducción automática, los automóviles sin conductor, la optimización de motores de búsqueda son problemas deseables bien definidos. Sin embargo, la falta de problemas deseables bien definidos es la razón por la que es tan difícil producir, por ejemplo, un robot de limpieza general de la casa. Las tareas domésticas sencillas, por ejemplo, recoger tazas y poner la ropa en el cesto, requieren resolver demasiados problemas. Por ejemplo, requiere que la máquina identifique qué objetos hay que recoger (tazas, ropa sucia y no limpia, etc.), dónde ir y cómo llegar (evitar obstáculos en el hogar y viajar al lugar deseado). ubicación), manipular cada objeto con la potencia deseada para que no rompa la taza o la ropa, etc.
En segundo lugar, desarrollar un algoritmo de aprendizaje automático requiere acceso a datos limpios y bien etiquetados . Esto se debe a que estos algoritmos se construyen alimentando diferentes modelos estadísticos con una gran cantidad de datos bien etiquetados, para establecer las relaciones predictivas necesarias. Este ejercicio de recopilación de datos puede ser difícil o fácil, según la aplicación comercial que esté desarrollando. Por ejemplo, para recopilar los datos necesarios necesarios para desarrollar un algoritmo de visión por computadora para campos de uvas para vino, mi startup necesitaba imágenes de campo de diferentes ubicaciones con diferentes variedades y, lo que es más difícil, diferentes temporadas. Dado que cada temporada es de un año, llevará años obtener productos satisfactorios. Por el contrario, si desea desarrollar un buen algoritmo de reconocimiento facial en China, para recolectar, por ejemplo, 10 millones de imágenes, solo necesita configurar una cámara en una calle concurrida en Beijing durante una semana y completar la tarea. Otro ejemplo sería Toutiao, el agregador de noticias personalizado basado en IA n.° 1 en China, que aprende sobre sus preferencias personales de noticias y solo le muestra las noticias más relevantes para usted. La recopilación de datos, en este caso, es nuevamente mucho más fácil, por ejemplo, la cantidad de artículos que lee en cada categoría de noticias, la cantidad de tiempo que dedica a cada artículo, etc.
En tercer lugar, una empresa de IA necesita desarrollar algoritmos robustos y escalables . Para lograr esto, hay tres elementos imprescindibles: una gran cantidad de datos bien etiquetados (como se discutió anteriormente), el talento adecuado y la confianza de que el aprendizaje profundo es la tecnología correcta para resolver el problema. El negocio de IA necesita tener el talento adecuado para desarrollar los algoritmos necesarios, pero estos son altamente especializados, costosos y escasos. Por ejemplo, cuando buscaba contratar para mi startup, descubrí que, como mínimo, necesitaba científicos de datos (generalmente doctores) para desarrollar prototipos de algoritmos, ingenieros para diseñar marcos, programadores (TensorFlow, Python, C ++, etc.) para codificar. en programas escalables y personas para armarlos (gerente de producto, UX, UI, etc.).
Otra consideración es el poder de cómputo . ¿Por qué? Porque las redes neuronales de aprendizaje profundo requieren muchos más cálculos que los otros métodos de IA. Por ejemplo, para la misma tarea de identificar un perro en una imagen, entrenar el modelo usando un algoritmo de aprendizaje no profundo podría necesitar, digamos, 10 modelos estadísticos con un conjunto de datos de 1 GB. El modelo de redes neuronales profundas podría necesitar, por ejemplo, 1000 modelos estadísticos que se ejecuten en un conjunto de datos de 100 GB. Los resultados son mejores usando redes, pero la potencia computacional requerida es mucho mayor. Como resultado, estos modelos requieren no solo una computadora (como lo que hacemos en nuestra computadora personal), sino computación distribuida con cada GPU manejando, digamos, el 5% de la computación, para que 20 GPU juntas puedan manejar el volumen computacional requerido. Esto, a su vez, significa tener que construir sus propios servidores de clúster de GPU o alquilar la potencia informática de plataformas como AWS. La potencia informática de la computación en la nube o de sus propios servidores es costosa, aunque, para ser justos, el costo unitario de la computación debería disminuir continuamente (según la ley de Moore).
Conclusión
Muchos creen que ahora es el mejor momento para ver avances y nuevas empresas de IA, porque la digitalización de muchas industrias y el Internet del consumidor hacen que una gran cantidad de datos digitales recopilados y organizados de manera limpia estén disponibles. El desarrollo de la GPU de Nvidia y la FPGA de Intel hace que sea mucho más barato y rápido realizar los cálculos necesarios. Por lo tanto, la ola actual de innovación en IA está impulsada por importantes avances en el aprendizaje profundo .
Pero para que una aplicación de IA tenga éxito, se necesita un problema deseable bien definido, datos, algoritmo y un poder de cómputo significativo. Para los ejecutivos que lean este artículo y estén considerando usar IA para potenciar su negocio, también se aplican los cuatro componentes clave mencionados anteriormente.
¿Cómo puedes aprender más sobre la IA? Hay muchos libros, seminarios, cursos de Coursera, trabajos de investigación y organizaciones como Deep Learning para aprender sobre la IA. Debido a que el enfoque de este artículo es para los inversionistas que desean conocer los conceptos básicos de la IA, no toqué muchos de los temas candentes de la IA, como el potencial de la IA como una amenaza, la perspectiva futura de la industria, las inversiones en IA, los pros. y contras de diferentes algoritmos (p. ej., CNN), creación de prototipos frente a escalado, principales lenguajes de programación, etc. En la Parte 2 de esta serie, profundizaré en cómo evaluar las empresas de IA desde la perspectiva de un inversor.