Os 17 principais projetos de aprendizado de máquina de código aberto [para calouros e experientes]

Publicados: 2020-12-22

Inteligência Artificial e Aprendizado de Máquina estão trazendo a Quarta Revolução Industrial. Empresas de todas as formas e tamanhos em todos os setores estão adotando essas tecnologias disruptivas para projetar soluções inovadoras que atendam às demandas de seus clientes-alvo.

Consequentemente, há uma enorme demanda por profissionais talentosos que são bem versados nas nuances de IA e ML. Na verdade, as empresas estão dispostas a pagar muito caro a candidatos merecedores com o conjunto de habilidades certo.

À luz da crescente demanda por habilidades de IA e ML, ajuda se você tiver alguns projetos do mundo real em seu currículo. Quando você trabalha em projetos, isso mostra aos empregadores em potencial que você tem a motivação e o conhecimento para se familiarizar com essas tecnologias.

Se você está procurando projetos inspiradores de Machine Learning de código aberto, você encontrou o lugar certo!

Índice

Projetos de aprendizado de máquina de código aberto

Projetos de aprendizado de máquina de código aberto do GitHub

1. DeOldify

DeOldify é um modelo de aprendizado profundo projetado para colorir e restaurar imagens antigas. Você pode colorir fotos antigas e filmar imagens com o DeOldify, que faz um trabalho fantástico ao incutir vida nelas! Ele foi atualizado para fornecer retoques mais detalhados e realistas para imagens em escala de cinza. Além disso, os resultados mostram consideravelmente menos viés azul com falhas mínimas.

2. Reconhecimento facial

Este aplicativo se orgulha de ser a “API de reconhecimento facial mais simples do mundo para Python e linha de comando”. Ele pode reconhecer e manipular rostos do Python ou da linha de comando usando o software de reconhecimento facial de última geração da dlib. Esse modelo de aprendizado profundo afirma ter uma taxa de precisão de 99,38% de acordo com o benchmark LFW . Você pode usar a ferramenta de linha de comando “face_recognition” para realizar o reconhecimento de rosto em uma pasta de imagem a partir da linha de comando!

3. Clonagem de voz

Este projeto de ML é uma implementação do Transfer Learning from Speaker Verification para Multispeaker Text-To-Speech Synthesis (SV2TTS). O SV2TTS é uma ferramenta de aprendizado profundo que pode gerar uma representação numérica de uma voz a partir de qualquer clipe de áudio e treinar um modelo de conversão de texto em fala para generalizar para novas vozes. Este aplicativo pode clonar qualquer voz em 5 segundos e produzir fala arbitrária, tudo em tempo real!

4. NeuralTalk2

NeuralTalk2 é essencialmente um código de captura de imagens escrito em Lua. Ele roda em GPU e requer Torch. O NeuralTalk2 pode legendar imagens/vídeos com frases aproveitando a Rede Neural Recorrente Multimodal. Esta é uma ferramenta ideal para criadores de conteúdo de mídia social – você pode gerar legendas para suas imagens/vídeos, e você também pode usar este modelo para criar conteúdo de imagem/vídeo engraçado (aqueles com legendas engraçadas).

Leia: Carreira em Machine Learning

5. U-GAT-IT

U-GAT-IT (Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation) é um projeto de ML com um foco simples – traduzir a imagem de uma pessoa em seu avatar de anime. Este modelo pode converter imagens que exigem mudanças holísticas e imagens que exigem grandes variações de forma, aproveitando uma nova técnica de tradução de imagem para imagem não supervisionada. Escusado será dizer que este é o projeto perfeito para os amantes de anime!

6. Srez

O Srez usa aprendizado profundo para super-resolução de imagem - ele pode aumentar imagens de 16 × 16 quatro vezes sua resolução para gerar fotos de 64 × 64. Os resultados retratam características nítidas e distintas que parecem louváveis o suficiente em comparação com o conjunto de dados de treinamento. A arquitetura subjacente inclui um DCGAN que aceita as entradas de imagem 16×16 para a rede geradora em vez da distribuição gaussiana multinomial.

7. AVA

AVA é uma estrutura que visa fornecer análises visuais automatizadas e com inteligência artificial. O primeiro “A” no AVA tem várias conotações – é uma estrutura do Alibaba que se esforça para se tornar uma “solução automatizada e orientada por IA que suporta análises aumentadas”. O AVA inclui três pacotes, a saber, CKB (espaço de armazenamento de conhecimento empírico para visualização/gráficos), DataWizard (biblioteca de processamento de dados) e ChartAdvisor (o componente principal que sugere gráficos de acordo com o conjunto de dados e os requisitos de análise).

8. Megatron

Desenvolvido pela equipe de pesquisa de aprendizado profundo aplicado da NVIDIA, o Megatron é um poderoso transformador que pode treinar modelos de linguagem volumosos para melhorar seu desempenho à medida que aumentam. É um projeto em andamento que oferece suporte ao treinamento de vários nós paralelo ao modelo de BERT e GPT2 por meio de precisão mista.

Projetos de aprendizado de máquina de código aberto do Google

9. Caliban

Caliban é uma ferramenta projetada para desenvolver fluxos de trabalho de pesquisa de ML e notebooks em ambientes Docker isolados e reproduzíveis. A melhor parte – você nem precisa aprender os meandros do Docker para usar o Caliban! Com o Caliban, você pode criar e executar modelos de ML em sua máquina e também enviar o código local para a nuvem. Essa ferramenta é perfeita para fluxos de trabalho de ML em Pytorch, Tensorflow e JAX.

10. Budou

Budou é uma ferramenta de quebra de linha automática projetada para idiomas CJK (chinês, japonês e coreano). Ele traduz automaticamente o texto CJK em código HTML organizado, resultando em uma bela tipografia. Budou fragmenta títulos e frases em várias linhas de pedaços significativos de acordo com a largura da tela do navegador.

11. Impacto Causal

Este projeto do Google é uma biblioteca de estatísticas que estima o efeito causal de uma intervenção em um modelo de série temporal. O pacote CausalImpact R usa uma série temporal Bayesiana estrutural para determinar como a métrica de resposta evolui após a intervenção se ela não tivesse ocorrido em primeiro lugar. Por exemplo, é bastante desafiador responder a uma pergunta como “quantos novos cliques uma campanha de marketing específica gerou?” sem usar um experimento aleatório. CausalImpact pode ajudar a encontrar respostas para essas perguntas.

12. Laboratório DeepMind

O DeepMind Lab é uma plataforma de jogos 3D em primeira pessoa totalmente personalizável para P&D de sistemas de Inteligência Artificial e Machine Learning. Ele consiste em uma série de quebra-cabeças desafiadores e tarefas de navegação que são fundamentais no aprendizado por reforço profundo. O DeepMind Lab possui uma API organizada e flexível que permite criar designs de tarefas inovadores e designs de IA exclusivos que podem ser iterados imediatamente. O DeepMind do Google usa o DeepMind Lab extensivamente para pesquisar e treinar agentes de aprendizado de IA/ML.

13. Variante Profunda

DeepVariant é um pipeline de análise que aproveita uma rede neural para encontrar variantes genéticas de dados de sequenciamento de DNA de última geração. Ele usa a biblioteca Nucleus (contendo código Python e C++) para ler e gravar dados em formatos de arquivo genômicos comuns que se integram perfeitamente ao TensorFlow.

14. Dopamina

É uma estrutura de pesquisa baseada no TensorFlow criada para prototipagem rápida de algoritmos de aprendizado por reforço. A dopamina foi projetada como uma base de código pequena e intuitiva que permite aos usuários experimentar ideias radicais e pesquisas especulativas. Ele tem quatro princípios básicos de design:

Experimentação fácil
Desenvolvimento flexível
Implementação compacta e confiável
Resultados reproduzíveis

15. Pintassilgo

Goldfinch é um conjunto de dados criado para resolver desafios de reconhecimento de baixa granularidade. Ele inclui uma coleção de diferentes categorias – pássaro, borboleta, cachorro, aeronave e outras categorias, juntamente com URLs de pesquisa relevantes do Flickr e pesquisas de imagens do Google. A categoria cão inclui inúmeras anotações de aprendizado ativo. O Google usa Goldfinch para explorar técnicas de visão computacional e aprendizado de máquina para problemas de reconhecimento de baixa granularidade.

16. Kubeflow

Kubeflow é um kit de ferramentas de ML desenvolvido exclusivamente para Kubernetes. Ele torna a implantação de fluxos de trabalho de aprendizado de máquina (ML) no Kubernetes portátil e escalável. O principal objetivo é oferecer uma maneira simples de implantar o melhor sistema operacional para ML em infraestruturas múltiplas e variadas. Você pode executar o Kubeflow em qualquer sistema ou ambiente executando o Kubernetes.

17. Magenta

Este é um projeto de pesquisa desenvolvido para explorar como o Machine Learning na criação de música e arte. O foco principal deste projeto é construir algoritmos de aprendizado profundo e aprendizado de reforço para produzir músicas, imagens, desenhos e outros conteúdos criativos. É uma tentativa de criar ferramentas inteligentes que aprimorem as habilidades e o potencial de artistas e músicos.

Conclusão

Para encerrar, nosso conselho final seria analisar esses projetos e desintegrá-los para entender as nuances mais profundas. Isso ajudará a enriquecer seu conhecimento de ML e ensinará como as tecnologias de ML funcionam de maneira diferente em cada projeto.

Esperamos que, ao se aprofundar nesses 17 projetos de Machine Learning de código aberto, você encontre inspiração para desenvolver seu próprio projeto de Machine Learning!

Se você estiver interessado em aprender mais sobre aprendizado de máquina, confira o PG Diploma in Machine Learning & AI do IIIT-B e upGrad, projetado para profissionais que trabalham e oferece mais de 450 horas de treinamento rigoroso, mais de 30 estudos de caso e atribuições, IIIT- B Status de ex-aluno, mais de 5 projetos práticos práticos e assistência de trabalho com as principais empresas.

Quais são os problemas que ocorrem ao usar a IA na área da saúde?

O campo da medicina exige transparência e capacidade de descrever decisões clínicas. O uso de deep learning e outros modelos de IA no setor de saúde é altamente benéfico, mas explicar os modelos é uma tarefa e tanto. Há também certas considerações éticas que os aplicativos clínicos de IA enfrentam, como preocupações de privacidade para dados usados para treinamento de modelos de IA e preocupações de segurança durante a implementação da IA no campo médico.

Como a IA torna a saúde menos cara em termos de tempo e dinheiro?

Os algoritmos de IA no campo da medicina são menos caros do que as abordagens tradicionais. As pessoas não precisam mais passar por uma série de testes laboratoriais caros devido ao uso da tecnologia de IA no sistema de saúde. Isso pode ser visto no potencial da IA em identificar biomarcadores capazes de detectar determinados distúrbios no corpo humano. Os algoritmos garantem que a maior parte do trabalho manual na especificação desses biomarcadores possa ser automatizada. Desta forma, eles economizam tempo que é muito crucial neste campo.

Como o uso de IA capacita os pacientes?

A tecnologia vestível, como relógios inteligentes, já está sendo usada por um grande número de pessoas em todo o mundo para capturar dados diários de saúde, desde padrões de sono até frequência cardíaca. Quando esses dados são combinados com o aprendizado de máquina, pode ser possível informar com sucesso aos indivíduos se eles correm risco de certas doenças muito antes que o risco se torne grave ou intratável. Atualmente, os aplicativos móveis fornecem informações de perfil do paciente em nível granular, o que pode ajudar os pacientes que vivem com certas condições crônicas a gerenciar melhor sua doença e, assim, viver uma vida mais saudável. Com essa abordagem, a IA tem o potencial de nos capacitar a tomar melhores decisões de saúde para nós mesmos.