Cómo crear un árbol de decisión perfecto | Algoritmo de árbol de decisión [con ejemplos]
Publicado: 2020-03-30Si se preguntaba 'cómo crear un árbol de decisión' o 'puedo crear un árbol de decisión en Java', ha venido al lugar correcto. En este artículo, encontraremos respuestas a tales preguntas, ya que discutiremos los árboles de decisión en detalle. Descubrirá qué son, por qué son tan populares y cómo puede crear uno de ellos.
Antes de crear un árbol de decisión, debe estar familiarizado con varios otros temas, como la regresión lineal y los algoritmos.
Leer más: Árbol de decisiones en R
Tabla de contenido
¿Qué es un árbol de decisión?
Un árbol de decisiones le brinda un mapa de todos los resultados posibles de selecciones particulares. Puede ayudarlo a planificar acciones futuras en diferentes escenarios de acuerdo con diferentes opciones. Puede comparar esos posibles resultados sobre la base de sus probabilidades y costos.
Como sugiere el nombre, un árbol de decisión muestra un gráfico que se asemeja a un árbol. Es un modelo de decisiones, junto con los resultados y consecuencias de cada una de ellas. Su objetivo final es ayudarlo a realizar la clasificación correctamente mientras pasa por el menor número de opciones posible.
También puede representar funciones booleanas utilizando árboles de decisión. Cada nodo hoja de un árbol de decisión es una etiqueta de clase y los nodos internos del árbol muestran los atributos. Comienzan con un nodo y luego se ramifican en todas las posibilidades. Cada una de esas ramas conduce a más nodos que representan otras posibles consecuencias. Puede crear un árbol de decisiones en Java.

Un árbol de decisión tiene varios tipos de nodos:
- Nodos de decisión
- Nodos de probabilidad
- Nodos finales
Los nodos finales reflejan el resultado final de una ruta de decisión, mientras que los nodos aleatorios muestran las posibilidades de resultados particulares. Los nodos de decisión indican la decisión que tomará que conduciría a los posibles resultados. Puede usar árboles de decisión para mapear predicciones algorítmicas, así como para tomar decisiones informales.
Ahora que está familiarizado con lo que es un árbol de decisiones, debemos centrarnos en profundizar un poco más y comprender por qué prevalece. Sumerjámonos.
Aplicaciones del Árbol de Decisión
Aquí hay algunas aplicaciones de los árboles de decisión para que pueda ver qué tan frecuentes son:
- Los bancos las utilizan para clasificar sus solicitudes de préstamo
- Los profesionales financieros utilizan árboles de decisión para la fijación de precios de opciones
- Categorización de los exámenes según el nivel de experiencia de los candidatos
- Elegir si aceptar o rechazar una oferta de trabajo
- Tomar decisiones comerciales esenciales, como si una empresa debe modificar su producto o no.
Usted mismo debe haber usado árboles de decisión al tomar varias decisiones en su vida. Solo piense en algunos escenarios en los que tuvo que tomar una decisión compleja.
Ventajas del árbol de decisión
Hay muchas ventajas en el uso de un árbol de decisión. Aquí están:
- Los árboles de decisión producen reglas que puede entender fácilmente. No tendría dificultad para transmitir esas reglas a otros sistemas.
- Pueden manejar tanto variables categóricas como continuas.
- Un árbol de decisiones le dará una indicación simple de la importancia de cada campo. Puedes hacer fácilmente predicciones (o clasificaciones) según las mismas.
- Los árboles de decisión también realizan una selección de características implícita que lo ayuda con la exploración de datos.
Más información: Algoritmos de inteligencia artificial

Desventajas del árbol de decisión
Todo tiene sus fallas y los árboles de decisión no son una excepción. Aquí hay algunos problemas con su uso:
- Los árboles de decisión no son útiles para realizar tareas de estimación. Esto se debe a que tales trabajos requieren la predicción del valor de un atributo continuo y los árboles de decisión no son buenos para eso.
- Computacionalmente, los árboles de decisión son más costosos que otras opciones. También le costará mucho entrenar un modelo de árbol de decisiones en comparación con otros. Los algoritmos de poda que usaría para crear árboles de decisión también son bastante costosos, ya que requieren la construcción de muchos subárboles.
- Si tiene una gran cantidad de ejemplos de clases pero una cantidad baja de ejemplos de capacitación, sus árboles de decisión no serían muy precisos y sus posibilidades de contener errores serían significativamente altas.
Cómo crear un árbol de decisión
Vamos a crear un árbol de decisiones sobre si una persona compraría una computadora o no. En este caso, tendríamos dos clases, 'Sí' y 'No'. La primera clase se refiere a las personas que comprarían una computadora, mientras que la segunda se refiere a las que no. Primero, calcularemos la ganancia de información y la entropía para estas clases.
Una vez que hayamos calculado la entropía de estas clases, nos centraremos en la obtención de información. Podemos clasificar los valores de Entropía así:
Si la entropía es 0, significa que los datos son puros (homogéneos)
Si Entropy es 1, significa que los datos son impuros (divididos a la mitad)
Supongamos que nuestra Entropía es impura. Luego dividiremos la ganancia de información por edad. De esta manera, nuestros datos mostrarán cuántas personas de un grupo de edad específico comprarán este producto y cuántas no. Podemos calcular la ganancia de información para múltiples atributos. Pero en nuestro ejemplo, encontramos que la ganancia de información es más alta para 'Edad' y la más baja para 'Ingresos'. Entonces, vamos con eso.
Aquí están las reglas de clasificación para este árbol de decisión:
Si alguien tiene menos de 30 años y no es estudiante, no comprará el producto, así que:
Edad (<30) ^ estudiante(no) = NO
Pero si alguien que tiene menos de 30 años y es estudiante, compraría el producto:
Edad (<30)^ estudiante(sí) = SÍ
Ahora bien, si su edad está entre los 31 y los 40, seguro que compraría el producto:
Edad(31…40) = SI
Una persona con una edad superior a 40 años y una calificación crediticia alta no compraría:
Edad (> 40) ^ credit_rating (alta) = NO
Por otro lado, si una persona mayor de 40 años pero con una calificación crediticia promedio, compraría el producto:

Edad (> 40) ^ credit_rating (normal) = SÍ
Siguiendo estos pasos, podrá crear el árbol de decisiones perfecto sin ninguna dificultad .
Conozca más sobre: Las 9 principales bibliotecas de aprendizaje automático que debe conocer
Conclusión
Ahora debes saber cómo crear un árbol de decisión. Puede aprender mucho más sobre los árboles de decisión y los algoritmos relevantes en nuestro curso de aprendizaje automático. Estamos seguros de que mejorará su conocimiento allí, ya que aprenderá cómo puede crear un árbol de decisiones en Java, cómo puede usarlos en la vida real y más.
Si está interesado en obtener más información sobre el aprendizaje automático, consulte el Diploma PG en aprendizaje automático e IA de IIIT-B y upGrad, que está diseñado para profesionales que trabajan y ofrece más de 450 horas de capacitación rigurosa, más de 30 estudios de casos y asignaciones, IIIT- B Estado de exalumno, más de 5 proyectos prácticos finales prácticos y asistencia laboral con las mejores empresas.