Cartilha de investimento em IA: lançando as bases (Parte I)
Publicados: 2022-03-11Sumário executivo
O que é IA?
- A Inteligência Artificial (IA), pode ser simplesmente explicada como inteligência demonstrada por máquinas, em contraste com a inteligência natural exibida por humanos e outros animais.
- O aprendizado de máquina é um subconjunto de técnicas usadas em IA, e o aprendizado profundo é um subconjunto de técnicas usadas em aprendizado de máquina.
- Houve três ondas significativas de desenvolvimento de IA. A primeira nas décadas de 50 e 60, a segunda nas décadas de 80 e 90, e a terceira começou há uma década e vem ganhando destaque desde 2016 (AlphaGo).
O que há de especial nessa onda de IA?
- Essa onda de IA é impulsionada pelo crescimento e popularidade do aprendizado profundo.
- Embora as técnicas de aprendizado profundo existam desde os anos 60, o poder de computação e os dados necessários não eram avançados o suficiente para suportar aplicações comerciais em massa até os últimos anos.
- A razão pela qual o aprendizado profundo é tão empolgante é que, simplesmente, o aprendizado profundo permite um desempenho muito mais poderoso do que outros algoritmos de aprendizado.
Componentes-chave de aplicativos de IA bem-sucedidos.
- Os aplicativos de IA precisam resolver um problema bem definido (específico) e desejável (direcionar pontos de dor urgentes e claros do cliente). Reconhecimento facial, tradução automática, carros autônomos, otimização de mecanismos de busca são todos problemas desejáveis bem definidos. No entanto, a falta de problemas desejáveis bem definidos é o motivo pelo qual é difícil produzir, por exemplo, um robô geral de limpeza doméstica.
- Os algoritmos de aprendizado de máquina exigem acesso a dados limpos e bem rotulados. Este exercício de coleta de dados pode ser difícil ou fácil, dependendo de qual aplicativo comercial você está desenvolvendo.
- Uma empresa de IA precisa desenvolver algoritmos robustos e escaláveis. Para conseguir isso, há três itens obrigatórios: uma grande quantidade de dados bem rotulados, o talento certo e a confiança de que o aprendizado profundo é a tecnologia correta para resolver o problema.
- Aplicativos de IA bem-sucedidos exigem muito poder de computação. Quanto mais avançado o algoritmo de inteligência artificial (por exemplo, redes neurais de aprendizado profundo), mais poder computacional é necessário, mais cara a operação em mãos.
Nos últimos anos, o mundo testemunhou uma explosão de interesse em torno da Inteligência Artificial (IA). Um conceito antes confinado principalmente ao gênero Sci-Fi, a IA se tornou parte de nossas vidas cotidianas. Lemos sobre isso o tempo todo nos noticiários, vemos vídeos de robôs de aparência assustadora dançando ao som de Uptown Funk e ouvimos sobre como os aplicativos de IA estão se insinuando até nas esferas mais inesperadas de nossas vidas diárias. Mas é um exagero?
Poderia ser. De acordo com o Hype Cycle for Emerging Technologies do Gartner, as tendências democratizadas de IA, incluindo AI PaaS (plataforma como serviço), Inteligência Artificial Geral, Condução Autônoma, Aprendizado Profundo, estão todas em vários pontos da curva, com Deep Neural Nets no pico de expectativas infladas. No entanto, também já estamos nos beneficiando da IA todos os dias. De Siri a Cortana e Alexa, agora podemos conversar com assistentes inteligentes. Do mecanismo de pesquisa com inteligência artificial do Google aos filtros do Instagram, agora desfrutamos da conveniência de respostas rápidas e mais relevantes às nossas necessidades. Na China, onde a inovação em IA está prosperando, empresas como a tecnologia de reconhecimento facial da Face++ estão fornecendo autenticação instantânea de identidade para bancos, enquanto aplicativos como o TikTok enviam vídeos curtos para milhões de adolescentes (na verdade, gerando considerável controvérsia ao fazê-lo).
Pessoalmente, acredito que, embora existam certamente algumas expectativas e negócios superestimados, a IA é o futuro . Fundei minha própria startup de IA em estágio inicial para capturar essa oportunidade única na vida de participar da revolução tecnológica. Como ex-investidor de capital de risco, também estou constantemente procurando oportunidades de investimento em IA. Acredito, portanto, que, apesar do ruído inegável em torno do espaço, o enorme aumento no investimento em IA também se justifica.
Mas com isso em mente, me surpreende que, particularmente entre a comunidade de investimentos, ainda haja uma grande lacuna de compreensão. Os investidores estão ansiosos para colocar o dinheiro para trabalhar, mas muitas vezes carecem de conhecimentos básicos importantes que, na minha opinião, são necessários para ser um investidor eficaz neste espaço. O objetivo deste artigo é, portanto, compartilhar e fornecer algum contexto e informações úteis para os interessados em investir neste campo emocionante. Dada a amplitude do tópico em questão, dividi meus pensamentos em duas partes, a primeira destinada a discutir alguns elementos essenciais que você precisa saber para começar a jornada da IA - uma espécie de 101. A segunda parte desta série será mais prática e aprofundará o tópico de como avaliar os investimentos em IA e as diferentes formas de investir.
NB Este post não pretende ser técnico. Destina-se a investidores e à comunidade financeira em geral e, portanto, a leitores não técnicos.
O que é IA?
Na verdade, existem muitas definições de IA, então, quando me pedem para defini-la, geralmente uso a boa e velha Wikipedia, que, para o público não técnico, acho que fornece uma definição satisfatória:
A inteligência artificial (IA), às vezes chamada de inteligência de máquina, é a inteligência demonstrada por máquinas, em contraste com a inteligência natural exibida por humanos e outros animais.
Em outras palavras, qualquer inteligência não natural é inteligência “artificial”, independentemente de como é alcançada. As técnicas usadas para alcançar a IA incluem regras se-então, lógica, árvores de decisão, regressões e aprendizado de máquina, incluindo aprendizado profundo. Uma das minhas ferramentas favoritas e divertidas para explicar como a IA funciona é este vídeo sobre como um computador aprende a jogar Super Mario.
Ao falar sobre IA, você invariavelmente ouvirá esses três termos-chave: IA, aprendizado de máquina e aprendizado profundo. Eles às vezes são usados de forma intercambiável, mas são diferentes. Simplificando, o aprendizado de máquina é um subconjunto de técnicas usadas em IA. O aprendizado profundo é um subconjunto de técnicas usadas no aprendizado de máquina .
O blog da Nvidia faz um bom trabalho ao resumir a relação entre os três termos. Ele também fornece uma visão geral útil das três ondas de desenvolvimento de IA. A primeira onda de IA foi nos anos 50 e 60 e viu alguns dos primeiros grandes marcos, como quando o IBM 701 venceu o jogo de damas sobre o mestre de damas Robert Nealey. Nos anos 80 e 90, o Deep Blue derrotou o mestre humano Kasparov no xadrez. Em março de 2016, o AlphaGo venceu o jogador nº 1 em Go Lee Sedol. Toda vez que a IA derrotou os mestres humanos nos jogos, desencadeou um novo estágio de hype para a IA. Então, como a tecnologia não poderia fornecer aplicativos que atendessem às expectativas do público, o hype da IA se transformaria no inverno da IA, com investimentos e bolsas de pesquisa reduzidos.
Como mencionado anteriormente, o aprendizado de máquina é um subconjunto da IA. De acordo com a Nvidia, o aprendizado de máquina em sua forma mais básica é “a prática de usar algoritmos para analisar dados, aprender com eles e depois fazer uma determinação ou previsão sobre algo no mundo. Então, em vez de rotinas de software de codificação manual com um conjunto específico de instruções para realizar uma tarefa específica, a máquina é 'treinada' usando grandes quantidades de dados e algoritmos que lhe dão a capacidade de aprender como executar a tarefa.” Um exemplo muito comum de aprendizado de máquina é o filtro de spam. O filtro de spam do Google pode reconhecer spam identificando palavras-chave como "Príncipe", "Nigéria" e "relógio de luxo". Ele também pode continuar a “aprender” com a classificação manual de spam dos usuários. Por exemplo, um e-mail com a mensagem “envie $1000 para obter este medicamento exclusivo contra o câncer para a seguinte conta bancária” foi perdido pelo filtro de spam do Google. Depois que um usuário o rotula como spam, o Gmail analisa todas as palavras-chave desse e-mail específico e “aprende” a tratar e-mails contendo as palavras combinadas “$ 1000”, “droga” e “conta bancária” como spam daqui para frente. Existem muitos modelos matemáticos empregados por profissionais para fazer aprendizado de máquina, por exemplo, regressões, logística, redes Bayesianas, clustering.
O que há de especial nessa onda de IA?
Essa onda de IA é impulsionada pela popularidade do aprendizado profundo . Como um subconjunto do aprendizado de máquina, o aprendizado profundo não foi inventado recentemente. De fato, de acordo com a Wikipedia, “o primeiro algoritmo geral de aprendizado funcional para perceptrons multicamadas supervisionados, profundos e avançados foi publicado por Alexey Ivakhnenko e Lapa em 1965”. No entanto, como o poder de computação e os dados não eram avançados o suficiente para suportar a aplicação comercial em massa de técnicas de aprendizado profundo, ele não ganhou popularidade até 2006, quando Geoffrey Hinton et al publicaram seu artigo seminal, “A Fast Learning Algorithm for Deep Belief Redes.” Apesar do inverno de IA dos anos 90 e da primeira metade dos anos 2000, alguns estudiosos, incluindo os três gurus acadêmicos do aprendizado profundo, Geoffrey Hinton, Yann LeCun e Yoshua Bengio, continuam trabalhando em aprendizado profundo no campo acadêmico. O rápido avanço do poder de computação, por exemplo, computação em nuvem e GPUs, juntamente com a disponibilidade de big data por meio da economia digital, tornaram possível a implementação de algoritmos de aprendizado profundo na última década. Por exemplo, a pesquisa de carros autônomos do Google começou em 2009.

Tecnicamente falando, o aprendizado profundo pode ser definido como “uma classe de algoritmos de aprendizado de máquina que:
- use uma cascata de várias camadas de unidades de processamento não linear para extração e transformação de recursos. Cada camada sucessiva usa a saída da camada anterior como entrada.
- aprender de maneira supervisionada (por exemplo, classificação) e/ou não supervisionada (por exemplo, análise de padrões).
- aprender vários níveis de representações que correspondem a diferentes níveis de abstração; os níveis formam uma hierarquia de conceitos”.
A chave é “múltiplas camadas”, em comparação com o aprendizado de máquina tradicional. Por exemplo, como você distinguiria um gato de um cachorro? Se você usar o aprendizado de máquina, poderá extrair alguns recursos comuns a cães e gatos, como duas orelhas, um rosto peludo, a distância entre os olhos e o nariz e a boca etc. E você pode obter um resultado dizendo a imagem é 50% cachorro, 50% gato - não é muito útil. Usando o aprendizado profundo, no entanto, você nem sabe quais são as características distintivas de um gato versus um cachorro, mas a máquina, por meio de várias camadas de criação de novos recursos e centenas (ou milhares) de modelos estatísticos, forneceria um saída precisa - por exemplo, 90% cão, 10% gato. Os dois gráficos abaixo ilustram como uma rede neural “aprende” e a diferença entre o aprendizado de máquina clássico e as redes neurais.
Os leitores podem ficar coçando a cabeça depois de ler o acima, e com razão. Mas voltando ao nosso propósito original: do ponto de vista de um investidor, o que há de tão especial no deep learning? Pode-se responder a essa pergunta com várias explicações técnicas complicadas, mas, de forma bem simples, o gráfico abaixo à esquerda faz um ótimo trabalho ao deixar isso realmente claro: o aprendizado profundo permite um desempenho muito mais poderoso do que outros algoritmos de aprendizado. Veja o exemplo do reconhecimento de fala detalhado pelo blog da Microsoft (gráfico abaixo à direita): a taxa de erro de reconhecimento de fala original de 1988 era de 60 a 70%, enquanto o novo sistema da Microsoft usando aprendizado profundo era de apenas 6,3% em 2014.
Componentes-chave de aplicativos de IA bem-sucedidos
Acredito que há 4 componentes-chave para o sucesso de um produto de aprendizado de máquina (incluindo aprendizado profundo): problemas desejáveis bem definidos, dados, algoritmo(s) e poder de computação .
Em primeiro lugar, o aplicativo de IA precisa resolver um problema bem definido (específico) e desejável (direcionar pontos problemáticos urgentes e claros do cliente) . Pense nos diferentes jogos que o computador foi ensinado a jogar nas 3 ondas diferentes de IA: dama, xadrez, Go. Eram problemas muito bem definidos e, portanto, mais fáceis para um computador resolver. Reconhecimento facial, tradução automática, carros autônomos, otimização de mecanismos de busca são todos problemas desejáveis bem definidos. No entanto, a falta de problemas desejáveis bem definidos é o motivo pelo qual é tão difícil produzir, por exemplo, um robô de limpeza geral de casas. Tarefas domésticas simples, por exemplo, recolher os copos e colocar a roupa no cesto, exigem a resolução de muitos problemas. Por exemplo, exige que a máquina identifique quais objetos precisam ser recolhidos (copos, roupas sujas e não limpas, etc.), para onde ir e como ir até lá (evitar obstáculos na casa e viajar até o local desejado). localização), manuseando cada objeto com a potência desejada para que não quebre o copo ou a roupa, etc.
Em segundo lugar, desenvolver um algoritmo de aprendizado de máquina requer acesso a dados limpos e bem rotulados . Isso porque esses algoritmos são construídos alimentando diferentes modelos estatísticos com uma grande quantidade de dados bem rotulados, para estabelecer as relações preditivas necessárias. Este exercício de coleta de dados pode ser difícil ou fácil, dependendo de qual aplicativo comercial você está desenvolvendo. Por exemplo, para coletar os dados necessários para desenvolver algoritmo de visão computacional para campos de uvas para vinho, minha startup precisava de imagens de campo de diferentes locais com diferentes variedades e ainda mais difíceis - diferentes estações. Com cada estação sendo um ano, levará anos para obter produtos satisfatórios. Por outro lado, se você deseja desenvolver um bom algoritmo de reconhecimento facial na China, para coletar, por exemplo, 10 milhões de imagens, basta configurar uma câmera em uma rua movimentada de Pequim por uma semana e a tarefa concluída. Outro exemplo seria o agregador de notícias personalizado com inteligência artificial nº 1 na China, o Toutiao, que aprende sobre suas preferências pessoais de notícias e mostra apenas as notícias mais relevantes para você. A coleta de dados, neste caso, também é muito mais fácil, por exemplo, o número de artigos que você lê em cada categoria de notícias, o tempo gasto em cada artigo etc.
Terceiro, uma empresa de IA precisa desenvolver algoritmos robustos e escaláveis . Para conseguir isso, existem três itens obrigatórios: uma grande quantidade de dados bem rotulados (como discutido acima), o talento certo e a confiança de que o aprendizado profundo é a tecnologia correta para resolver o problema. Os negócios de IA precisam ter o talento certo para desenvolver os algoritmos necessários, mas eles são altamente especializados, caros e escassos. Por exemplo, quando eu estava procurando contratar para minha startup, descobri que, no mínimo, eu precisava de cientistas de dados (geralmente PhDs) para desenvolver protótipos de algoritmos, engenheiros para projetar frameworks, programadores (TensorFlow, Python, C++ etc) para codificar em programas escaláveis e pessoas para juntá-los (gerente de produto, UX, UI, etc).
Outra consideração é o poder de computação . Por quê? Porque as redes neurais de aprendizado profundo exigem muito mais computação do que os outros métodos de IA. Por exemplo, para a mesma tarefa de identificar um cachorro em uma imagem, treinar o modelo usando algoritmo de aprendizado não profundo pode precisar, digamos, de 10 modelos estatísticos com um conjunto de dados de 1 GB. O modelo de redes neurais profundas pode precisar, digamos, de 1.000 modelos estatísticos executados em um conjunto de dados de 100 GB. Os resultados são melhores usando redes, mas o poder computacional necessário é muito maior. Como resultado, esses modelos exigem não apenas um computador (como o que fazemos em nosso computador pessoal), mas computação distribuída com cada GPU manipulando, digamos, 5% da computação, para que 20 GPUs juntas possam lidar com o volume computacional necessário. Isso, por sua vez, significa ter que construir seus próprios servidores de cluster de GPU ou alugar o poder de computação de plataformas como a AWS. O poder de computação da computação em nuvem ou de seus próprios servidores é caro, embora, para ser justo, o custo unitário da computação deva diminuir continuamente (de acordo com a lei de Moore).
Conclusão
Muitos acreditam que agora é o melhor momento para ver inovações e startups de IA, porque a digitalização de muitos setores e da internet do consumidor disponibiliza uma grande quantidade de dados digitais coletados propositadamente e organizados de forma limpa. O desenvolvimento da GPU da Nvidia e do FPGA da Intel torna muito mais barato e rápido realizar os cálculos necessários. A atual onda de inovação da IA é, portanto, impulsionada por importantes avanços no aprendizado profundo .
Mas, para que um aplicativo de IA seja bem-sucedido, é necessário um problema desejável bem definido, dados, algoritmo e poder de computação significativo. Para os executivos que estão lendo este artigo considerando o uso da IA para capacitar seus negócios, os quatro principais componentes mencionados acima também se aplicam.
Como você pode aprender mais sobre IA? Existem muitos livros, seminários, cursos do Coursera, trabalhos de pesquisa e organizações como Deep Learning para aprender sobre IA. Como o foco deste artigo é para investidores que desejam conhecer os fundamentos da IA, não toquei em muitos dos tópicos importantes da IA, como o potencial da IA como uma ameaça, as perspectivas futuras do setor, investimentos em IA, os prós e contras de diferentes algoritmos (por exemplo, CNN), prototipagem versus dimensionamento, principais linguagens de programação, etc. Na Parte 2 desta série, vou me aprofundar em como avaliar empresas de IA da perspectiva do investidor.