Como criar uma árvore de decisão perfeita. Algoritmo de árvore de decisão [com exemplos]
Publicados: 2020-03-30Se você estava se perguntando 'como criar uma árvore de decisão' ou 'posso criar uma árvore de decisão em Java', você veio ao lugar certo. Neste artigo, encontraremos respostas para essas perguntas, pois discutiremos detalhadamente as árvores de decisão. Você descobrirá o que são, por que são tão populares e como você pode criar um deles.
Antes de criar uma árvore de decisão, você deve estar familiarizado com vários outros tópicos, como Regressão Linear e algoritmos.
Leia mais: Árvore de decisão em R
Índice
O que é uma árvore de decisão?
Uma árvore de decisão fornece um mapa de todos os resultados possíveis de seleções específicas. Ele pode ajudá-lo a planejar as ações futuras em diferentes cenários de acordo com diferentes escolhas. Você pode comparar esses resultados possíveis com base em suas probabilidades e custos.
Como o nome sugere, uma árvore de decisão mostra um gráfico semelhante a uma árvore. É um modelo de decisões, juntamente com os resultados e consequências de cada uma delas. Seu objetivo final é ajudá-lo a realizar a classificação corretamente enquanto passa pelo menor número possível de escolhas.
Você também pode representar funções booleanas usando árvores de decisão. Cada nó folha de uma árvore de decisão é um rótulo de classe e os nós internos da árvore mostram os atributos. Eles começam com um nó e depois se ramificam em todas as possibilidades. Cada um desses ramos leva a mais nós que representam outras consequências possíveis. Você pode criar uma árvore de decisão em Java.

Uma árvore de decisão tem vários tipos de nós:
- Nós de decisão
- Nós de chance
- Nós finais
Os nós finais refletem o resultado final de um caminho de decisão, enquanto os nós de chance mostram as chances de resultados específicos. Os nós de decisão indicam a decisão que você tomará que levaria aos resultados possíveis. Você pode usar árvores de decisão para mapear previsões algorítmicas, bem como para tomar decisões informais.
Agora que você está familiarizado com o que é uma árvore de decisão, devemos nos concentrar em cavar um pouco mais fundo e entender por que ela é predominante. Vamos mergulhar.
Aplicações da Árvore de Decisão
Aqui estão algumas aplicações de árvores de decisão para que você possa ver como elas são predominantes:
- Os bancos os usam para classificar seus pedidos de empréstimo
- Profissionais de finanças usam árvores de decisão para precificação de opções
- Categorizar os exames de acordo com o nível de especialização dos candidatos
- Escolher se aceita ou rejeita uma oferta de emprego
- Tomar decisões de negócios essenciais, como se uma empresa deve modificar seu produto ou não.
Você deve ter usado árvores de decisão ao fazer várias escolhas em sua vida. Basta pensar em alguns cenários em que você teve que tomar uma decisão complexa.
Vantagens da Árvore de Decisão
Há muitas vantagens em usar uma árvore de decisão. Aqui estão eles:
- As árvores de decisão produzem regras que você pode entender facilmente. Você não teria dificuldade em transmitir essas regras para outros sistemas.
- Eles podem lidar com variáveis categóricas e contínuas
- Uma árvore de decisão lhe dará uma indicação simples da importância de cada campo. Você pode facilmente fazer previsões (ou classificações) de acordo com o mesmo.
- As árvores de decisão também realizam a seleção de recursos implicitamente, o que ajuda na exploração de dados.
Saiba mais: Algoritmos de Inteligência Artificial

Desvantagens da Árvore de Decisão
Tudo tem suas falhas, e as árvores de decisão não são exceção. Aqui estão alguns problemas ao usá-los:
- As árvores de decisão não são úteis para executar tarefas de estimativa. Isso porque esses trabalhos exigem a previsão do valor de um atributo contínuo, e as árvores de decisão não são boas nisso.
- Computacionalmente, as árvores de decisão são mais caras do que outras opções. Também custará muito treinar um modelo de árvore de decisão em comparação com outros. Os algoritmos de poda que você usaria para fazer árvores de decisão também são bastante caros, pois exigem a construção de muitas subárvores.
- Se você tiver um número alto de exemplos de classes, mas um número baixo de exemplos de treinamento, suas árvores de decisão não serão muito precisas e suas chances de conter erros serão significativamente altas.
Como criar uma árvore de decisão
Vamos criar uma árvore de decisão sobre se uma pessoa compraria ou não um computador. Neste caso, teríamos duas classes, 'Sim' e 'Não'. A primeira classe se refere às pessoas que comprariam um computador, enquanto a segunda se refere às que não comprariam. Primeiro, calcularemos o ganho de informação e a entropia para essas classes.
Depois de calcular a entropia dessas classes, vamos nos concentrar no ganho de informação. Podemos classificar os valores de Entropia assim:
Se a entropia for 0, significa que os dados são puros (homogêneos)
Se a entropia for 1, significa que os dados são impuros (divididos pela metade)
Vamos supor que nossa entropia seja impura. Então vamos dividir o ganho de informação por idade. Dessa forma, nossos dados mostrarão quantas pessoas de uma faixa etária específica comprarão este produto e quantas não comprarão. Podemos calcular o ganho de informação para vários atributos. Mas em nosso exemplo, descobrimos que o ganho de informação é maior para 'Idade' e o menor para 'Renda'. Então, vamos com isso.
Aqui estão as regras de classificação para esta árvore de decisão:
Se a idade de alguém for inferior a 30 anos e essa pessoa não for estudante, ela não comprará o produto, então:
Idade (<30) ^ aluno(não) = NÃO
Mas se alguém com menos de 30 anos e estudante, compraria o produto:
Idade (<30)^ aluno(sim) = SIM
Agora, se a idade deles estiver entre 31 e 40 anos, com certeza comprariam o produto:
Idade(31…40) = SIM
Uma pessoa com idade superior a 40 anos e uma alta classificação de crédito não compraria:
Idade(>40)^ credit_rating(alto) = NÃO
Por outro lado, se uma pessoa com mais de 40 anos, mas com uma classificação de crédito média, compraria o produto:

Idade(>40)^ credit_rating(normal) = SIM
Seguindo essas etapas, você poderá criar a árvore de decisão perfeita sem nenhuma dificuldade .
Saiba mais sobre: 9 principais bibliotecas de aprendizado de máquina que você deve conhecer
Conclusão
Agora você deve saber como criar uma árvore de decisão. Você pode aprender muito mais sobre árvores de decisão e os algoritmos relevantes em nosso curso de aprendizado de máquina. Temos certeza de que você aprimorará seu conhecimento lá, pois aprenderá como criar uma árvore de decisão em Java, como usá-la na vida real e muito mais.
Se você estiver interessado em aprender mais sobre aprendizado de máquina, confira o PG Diploma in Machine Learning & AI do IIIT-B e upGrad, projetado para profissionais que trabalham e oferece mais de 450 horas de treinamento rigoroso, mais de 30 estudos de caso e atribuições, IIIT- B Status de ex-aluno, mais de 5 projetos práticos práticos e assistência de trabalho com as principais empresas.