Árvore de decisão em IA: introdução, tipos e criação

Publicados: 2020-09-03

Uma árvore de decisão é a representação denotativa de um processo de tomada de decisão. Árvores de decisão em inteligência artificial são usadas para chegar a conclusões com base nos dados disponíveis de decisões tomadas no passado. Além disso, essas conclusões são atribuídas a valores, implantados para prever o curso de ação que provavelmente será tomado no futuro.

As árvores de decisão são modelos estatísticos e algorítmicos de aprendizado de máquina que interpretam e aprendem as respostas de vários problemas e suas possíveis consequências. Como resultado, as árvores de decisão conhecem as regras de tomada de decisão em contextos específicos com base nos dados disponíveis. O processo de aprendizagem é contínuo e baseado em feedback. Isso melhora o resultado da aprendizagem ao longo do tempo. Esse tipo de aprendizado é chamado de aprendizado supervisionado. Portanto, os modelos de árvore de decisão são ferramentas de apoio ao aprendizado supervisionado.

Assim, as árvores de decisão fornecem um processo científico de tomada de decisão baseado em fatos e valores, em vez de na intuição. Nos negócios, as organizações usam esse processo para tomar decisões de negócios significativas.

Aprenda cursos de IA e ML das melhores universidades do mundo. Ganhe Masters, Executive PGP ou Advanced Certificate Programs para acelerar sua carreira.

Índice

Tipo de Modelos de Árvore de Decisão

Esses modelos podem ser usados ​​para resolver problemas dependendo do tipo de dados que requerem previsão. Eles se enquadram nas seguintes categorias:

  1. Previsão de variáveis ​​contínuas
  2. Previsão de variáveis ​​categóricas

1. Previsão de Variáveis ​​Contínuas

A previsão de variáveis ​​contínuas depende de um ou mais preditores. Por exemplo, os preços das casas em uma área podem depender de muitas variáveis, como endereço, disponibilidade de comodidades como piscina, número de quartos, etc. Nesse caso, a árvore de decisão irá prever o preço de uma casa com base em várias variáveis valores. O valor previsto também será um valor variável.

O modelo de árvore de decisão usado para indicar tais valores é chamado de árvore de decisão de variável contínua. Várias árvores de decisão contínuas resolvem problemas do tipo regressão. Nesses casos, conjuntos de dados rotulados são usados ​​para prever uma saída contínua, variável e numerada.

Deve ler: Como criar uma árvore de decisão perfeita

2. Previsão de Variáveis ​​Categóricas

A previsão de variáveis ​​categóricas também é baseada em outras variáveis ​​categóricas ou contínuas. No entanto, em vez de prever um valor, esse problema é classificar um novo conjunto de dados nas classes disponíveis de conjuntos de dados. Por exemplo, analisar um comentário no Facebook para classificar o texto como negativo ou favorável. Realizar o diagnóstico de doença com base nos sintomas de um paciente também é um exemplo de modelo de árvore de decisão de variável categórica. As árvores de decisão de variáveis ​​categóricas resolvem problemas do tipo classificação em que a saída é uma classe em vez de um valor.

Confira: Árvore de decisão em R

Como as árvores de decisão em inteligência artificial são criadas

Como o nome sugere, o algoritmo de árvore de decisão está na forma de uma estrutura semelhante a uma árvore. Ainda assim, está invertido. Uma árvore de decisão começa na raiz ou no nó de decisão superior que classifica conjuntos de dados com base nos valores de atributos cuidadosamente selecionados.

O nó raiz representa todo o conjunto de dados. É aqui que a primeira etapa do algoritmo seleciona a melhor variável preditora. Isso o torna um nó de decisão. Também classifica todo o conjunto de dados em várias classes ou conjuntos de dados menores.

O conjunto de critérios para selecionar atributos é chamado de Attribute Selection Measures (ASM). O ASM é baseado em medidas de seleção, incluindo ganho de informação, entropia, índice de Gini, razão de ganho e assim por diante. Esses atributos, também chamados de recursos, criam regras de decisão que auxiliam na ramificação. O processo de ramificação divide o nó raiz em subnós, dividindo ainda mais em mais subnós até que os nós folha sejam formados. Nós folha não podem ser divididos mais.

Determinar se uma determinada imagem é de um gato ou de um cachorro é um exemplo típico de classificação. Aqui, as características ou atributos podem ser a presença de garras ou patas, comprimento das orelhas, tipo de língua, etc. O conjunto de dados será dividido em classes menores com base nessas variáveis ​​de entrada até que o resultado seja obtido.

Leia também: Classificação na Árvore de Decisão

Conclusão

As árvores de decisão são modelos de aprendizagem clássicos e naturais. Eles são baseados no conceito fundamental de dividir e conquistar. No mundo da inteligência artificial, as árvores de decisão são usadas para desenvolver máquinas de aprendizado, ensinando-as a determinar o sucesso e o fracasso. Essas máquinas de aprendizado analisam os dados recebidos e os armazenam.

Então, eles tomam inúmeras decisões com base em experiências de aprendizado anteriores. Essas decisões formam a base para a modelagem preditiva que ajuda a prever resultados para problemas. Nos negócios, as organizações usam essas técnicas para tomar inúmeras decisões de pequenas e grandes empresas que levam a ganhos ou perdas gigantes.

Confira o Programa de Certificação Avançado do upGrad em Aprendizado de Máquina e PNL. Este curso foi elaborado tendo em mente vários tipos de alunos interessados ​​em Machine Learning, oferecendo orientação individual e muito mais.

O que é um modelo de árvore de decisão em IA?

As árvores de decisão existem há muito tempo, mas recentemente vêm ganhando destaque na comunidade de aprendizado de máquina e ciência de dados. Uma árvore de decisão é um modelo que aprende com os dados e ajuda a prever a classe de um objeto com base em um conjunto de recursos. Uma árvore de decisão é um grafo acíclico no qual cada nó representa um teste em um recurso de entrada e cada ramo representa o resultado de um teste. Ao percorrer a árvore, o nó raiz contém a previsão para toda a árvore

Quais são as aplicações das árvores de decisão?

Os modelos são usados ​​em vários campos. Em biologia computacional, eles são frequentemente usados ​​para prever funções biológicas de proteínas ou sequências de DNA. Em epidemiologia, eles são usados ​​para determinar o risco de transmissão de doenças pelos indivíduos afetados. Na mineração de dados, eles são usados ​​para prever eventos futuros com base em eventos anteriores. Em finanças, eles são usados ​​para determinar o risco de inadimplência e, na engenharia de software, são usados ​​para determinar a prioridade dos defeitos de software.

Quais são os problemas enfrentados pelo algoritmo de árvore de decisão?

O maior problema com os modelos de árvore de decisão é que, em muitos casos, todas as árvores possíveis não são enumeradas, mesmo quando o número de estados possíveis (nós) é infinito, como no caso de uma pontuação BLEU desconhecida. Como sabemos, uma árvore de decisão é um algoritmo de aprendizado de máquina. É uma árvore de decisão binária. Uma árvore onde cada nó interno representa um teste em uma variável e cada nó folha representa um rótulo de classe. A árvore de decisão precisa tomar decisões sobre uma tupla de dados específica. Essa representação não é muito boa quando se trata de tomar uma decisão sobre uma variável contínua. Também tem uma limitação para trabalhar com dados que podem ser codificados como uma variável categórica.