Tipos de algoritmos de inteligência artificial que você deve conhecer [um guia completo]

Publicados: 2019-11-13

A Inteligência Artificial cresceu para ter um impacto significativo no mundo. Com grandes quantidades de dados sendo gerados por diferentes aplicativos e fontes, os sistemas de aprendizado de máquina podem aprender com os dados de teste e realizar tarefas inteligentes.

A Inteligência Artificial é o campo da ciência da computação que trata de transmitir a capacidade decisiva e pensar a capacidade de máquinas. A Inteligência Artificial é, portanto, uma mistura de ciência da computação, análise de dados e matemática pura.

O aprendizado de máquina se torna parte integrante da Inteligência Artificial e trata apenas da primeira parte, o processo de aprendizado a partir dos dados de entrada. A Inteligência Artificial e seus benefícios nunca deixaram de nos surpreender.

Participe dos cursos de IA on-line das principais universidades do mundo - mestrados, programas de pós-graduação executiva e programa de certificação avançada em ML e IA para acelerar sua carreira.

Índice

Tipos de algoritmos de inteligência artificial

Os algoritmos de inteligência artificial podem ser amplamente classificados como:

1. Algoritmos de Classificação

Os algoritmos de classificação fazem parte do aprendizado supervisionado. Esses algoritmos são usados ​​para dividir a variável sujeita em diferentes classes e então prever a classe para uma determinada entrada. Por exemplo, algoritmos de classificação podem ser usados ​​para classificar emails como spam ou não. Vamos discutir alguns dos algoritmos de classificação comumente usados.

a) Naïve Bayes

O algoritmo Naive Bayes trabalha com o teorema de Bayes e adota uma abordagem probabilística, ao contrário de outros algoritmos de classificação. O algoritmo tem um conjunto de probabilidades anteriores para cada classe. Uma vez que os dados são alimentados, o algoritmo atualiza essas probabilidades para formar algo conhecido como probabilidade posterior. Isso é útil quando você precisa prever se a entrada pertence a uma determinada lista de classes ou não.

b) Árvore de decisão

O algoritmo de árvore de decisão é mais um fluxograma como um algoritmo em que os nós representam o teste em um atributo de entrada e as ramificações representam o resultado do teste.

c) Floresta Aleatória

A floresta aleatória funciona como um grupo de árvores. O conjunto de dados de entrada é subdividido e alimentado em diferentes árvores de decisão. A média das saídas de todas as árvores de decisão é considerada. Florestas aleatórias oferecem um classificador mais preciso em comparação com o algoritmo de árvore de decisão.

d) Máquinas de vetores de suporte

SVM é um algoritmo que classifica dados usando um hiperplano, garantindo que a distância entre o hiperplano e os vetores de suporte seja máxima.

e) K Vizinhos mais próximos

O algoritmo KNN usa vários pontos de dados segregados em classes para prever a classe de um novo ponto de dados de amostra. É chamado de “algoritmo de aprendizado preguiçoso”, pois é relativamente curto em comparação com outros algoritmos.

2. Algoritmos de regressão

Algoritmos de regressão são um algoritmo popular em algoritmos de aprendizado de máquina supervisionado. Os algoritmos de regressão podem prever os valores de saída com base nos pontos de dados de entrada alimentados no sistema de aprendizado. A principal aplicação dos algoritmos de regressão inclui a previsão do preço do mercado de ações, previsão do tempo, etc. Os algoritmos mais comuns nesta seção são

a) Regressão linear

É usado para medir qualidades genuínas considerando as variáveis ​​consistentes. É o mais simples de todos os algoritmos de regressão, mas pode ser implementado apenas em casos de relacionamento linear ou um problema linearmente separável. O algoritmo desenha uma linha reta entre os pontos de dados chamada linha de melhor ajuste ou linha de regressão e é usado para prever novos valores.

Leia: Regressão Linear - Perguntas e Respostas da Entrevista de ML

b) Regressão de laço

O algoritmo de regressão Lasso funciona obtendo o subconjunto de preditores que minimiza o erro de previsão para uma variável de resposta. Isso é alcançado impondo uma restrição aos pontos de dados e permitindo que alguns deles reduzam para o valor zero.

c) Regressão Logística

A regressão logística é usada principalmente para classificação binária. Este método permite analisar um conjunto de variáveis ​​e prever um resultado categórico. Suas principais aplicações incluem prever o valor da vida útil do cliente, valores da casa, etc.

d) Regressão Multivariada

Este algoritmo deve ser usado quando há mais de uma variável preditora. Esse algoritmo é amplamente usado em mecanismos de recomendação de produtos do setor de varejo, onde os produtos preferidos dos clientes dependerão de vários fatores, como marca, qualidade, preço, revisão etc.

e) Algoritmo de Regressão Múltipla

O Algoritmo de Regressão Múltipla usa uma combinação de algoritmos de regressão linear e de regressão não linear usando várias variáveis ​​explicativas como entradas. As principais aplicações incluem pesquisa em ciências sociais, autenticidade de sinistros de seguros, análise comportamental, etc.

3. Algoritmos de agrupamento

Clustering é o processo de segregar e organizar os pontos de dados em grupos com base nas semelhanças entre os membros do grupo. Isso faz parte do aprendizado não supervisionado. O objetivo principal é agrupar itens semelhantes. Por exemplo, pode combinar todas as transações de natureza fraudulenta com base em algumas propriedades da transação. Abaixo estão os algoritmos de agrupamento mais comuns.

a) Agrupamento de K-Means

É o algoritmo de aprendizado não supervisionado mais simples. O algoritmo reúne pontos de dados semelhantes e, em seguida, os vincula em um cluster. O agrupamento é feito calculando o centróide do grupo de pontos de dados e então avaliando a distância de cada ponto de dados do centróide do cluster. Com base na distância, o ponto de dados analisado é então atribuído ao cluster mais próximo. 'K' em K-means representa o número de clusters nos quais os pontos de dados estão sendo agrupados.

b) Algoritmo Fuzzy C-means

O algoritmo FCM trabalha com probabilidade. Cada ponto de dados é considerado como tendo uma probabilidade de pertencer a outro cluster. Os pontos de dados não têm uma associação absoluta em um cluster específico, e é por isso que o algoritmo é chamado de fuzzy.

c) Algoritmo de Maximização de Expectativa (EM)

É baseado na distribuição gaussiana que aprendemos em estatística. Os dados são retratados em um modelo de distribuição gaussiana para resolver o problema. Após atribuir uma probabilidade, uma amostra pontual é calculada com base nas equações de expectativa e maximização.

d) Algoritmo de agrupamento hierárquico

Esses algoritmos classificam os clusters em ordem hierárquica depois de aprender os pontos de dados e fazer observações de similaridade. Pode ser de dois tipos

  • Agrupamento divisivo, para uma abordagem de cima para baixo
  • Clustering aglomerativo, para uma abordagem de baixo para cima

Vamos encerrar e concluir

A IA surpreendeu o mundo várias vezes e tem muitas aplicações no mundo real para resolver seus problemas complexos. Esperamos que este artigo tenha lançado alguma luz sobre os vários algoritmos de Inteligência Artificial e suas classificações amplas. Os algoritmos são escolhidos com base na necessidade e na natureza dos pontos de dados que temos.

Algoritmos têm suas vantagens e desvantagens em termos de precisão, desempenho e tempo de processamento. Estes são apenas alguns algoritmos. Se você estiver interessado em aprender mais, confira o Programa PG Executivo do upGrad & IIIT-B em Machine Learning & AI .

O que é ingênuo bayes?

O teorema de Bayes é usado no algoritmo Naive Bayes, que, ao contrário dos outros algoritmos desta lista, adota uma abordagem probabilística. Isso significa simplesmente que o método tem um conjunto de probabilidades anteriores estabelecidas para cada uma das classificações para seu alvo, em vez de pular direto para os dados. O algoritmo altera essas probabilidades anteriores para gerar a probabilidade posterior quando você alimenta os dados. Como resultado, isso pode ser incrivelmente benéfico em situações em que você precisa antecipar se sua entrada corresponde a uma das n classes ou a nenhuma delas. Isso é possível usando uma técnica probabilística porque as probabilidades lançadas para todas as n classes serão bastante baixas.

O que é uma árvore de decisão?

A Árvore de Decisão é simplesmente uma estrutura de árvore semelhante a um fluxograma em que cada nó externo representa uma tentativa em um atributo e cada ramo indica o resultado do teste. Os rótulos esperados são armazenados nos nós folha. Começamos na raiz da árvore e vamos até o nó folha comparando os valores dos atributos. Ao lidar com dados de alta dimensão e com pouco tempo gasto na preparação dos dados, empregamos este classificador. Uma palavra de cautela, no entanto: eles são propensos a overfitting e podem variar drasticamente mesmo com pequenas alterações nos dados de treinamento.

O que é uma máquina de vetores de suporte?

Na medida em que ele tenta classificar os pontos de dados com as margens entre duas classes tão amplas quanto possível, um SVM é único. Isso é chamado de separação máxima de margem. Outro ponto a ter em mente é que, ao contrário da regressão linear, os SVMs traçam o hiperplano usando apenas os vetores de suporte, enquanto a regressão linear usa o conjunto de dados completo. Os SVMs são particularmente benéficos em circunstâncias em que os dados têm muitas dimensões. Então você começa gerando um hiperplano aleatório e medindo a distância entre ele e os valores de dados mais próximos de cada classe. Os vetores de suporte são os pontos de dados mais próximos do hiperplano.