Árbol de decisiones en IA: introducción, tipos y creación

Publicado: 2020-09-03

Un árbol de decisión es la representación denotativa de un proceso de toma de decisiones. Los árboles de decisión en inteligencia artificial se utilizan para llegar a conclusiones basadas en los datos disponibles de decisiones tomadas en el pasado. Además, a estas conclusiones se les asignan valores, desplegados para predecir el curso de acción que probablemente se tomará en el futuro.

Los árboles de decisión son modelos estadísticos algorítmicos de aprendizaje automático que interpretan y aprenden las respuestas de varios problemas y sus posibles consecuencias. Como resultado, los árboles de decisión conocen las reglas de toma de decisiones en contextos específicos basados en los datos disponibles. El proceso de aprendizaje es continuo y se basa en la retroalimentación. Esto mejora el resultado del aprendizaje con el tiempo. Este tipo de aprendizaje se denomina aprendizaje supervisado. Por lo tanto, los modelos de árboles de decisión son herramientas de apoyo para el aprendizaje supervisado.

Por lo tanto, los árboles de decisión proporcionan un proceso científico de toma de decisiones basado en hechos y valores en lugar de la intuición. En los negocios, las organizaciones utilizan este proceso para tomar decisiones comerciales importantes.

Aprenda cursos de IA y ML de las mejores universidades del mundo. Obtenga programas de maestría, PGP ejecutivo o certificado avanzado para acelerar su carrera.

Tabla de contenido

Tipo de modelos de árboles de decisión

Estos modelos se pueden usar para resolver problemas según el tipo de datos que requieran predicción. Se dividen en las siguientes categorías:

Predicción de variables continuas
Predicción de variables categóricas

1. Predicción de Variables Continuas

La predicción de variables continuas depende de uno o más predictores. Por ejemplo, los precios de las casas en un área pueden depender de muchas variables, como la dirección, la disponibilidad de servicios como una piscina, la cantidad de habitaciones, etc. En este caso, el árbol de decisiones predecirá el precio de una casa en función de varias variables. valores. El valor predicho también será un valor variable.

El modelo de árbol de decisión utilizado para indicar dichos valores se denomina árbol de decisión de variable continua. Varios árboles de decisión continuos resuelven problemas de tipo regresión. En tales casos, los conjuntos de datos etiquetados se utilizan para predecir una salida continua, variable y numerada.

Debe leer: Cómo crear un árbol de decisión perfecto

2. Predicción de Variables Categóricas

La predicción de variables categóricas también se basa en otras variables categóricas o continuas. Sin embargo, en lugar de predecir un valor, este problema consiste en clasificar un nuevo conjunto de datos en las clases de conjuntos de datos disponibles. Por ejemplo, analizar un comentario en Facebook para clasificar el texto como negativo o de apoyo. Realizar un diagnóstico de enfermedad basado en los síntomas de un paciente también es un ejemplo de un modelo de árbol de decisión de variable categórica. Los árboles de decisión de variables categóricas resuelven problemas de tipo clasificación donde la salida es una clase en lugar de un valor.

Echa un vistazo a: Árbol de decisión en R

Cómo se crean los árboles de decisión en inteligencia artificial

Como sugiere el nombre, el algoritmo del árbol de decisiones tiene la forma de una estructura similar a un árbol. Sin embargo, está invertido. Un árbol de decisión comienza desde la raíz o el nodo de decisión superior que clasifica los conjuntos de datos en función de los valores de los atributos cuidadosamente seleccionados.

El nodo raíz representa todo el conjunto de datos. Aquí es donde el primer paso del algoritmo selecciona la mejor variable predictora. Lo convierte en un nodo de decisión. También clasifica todo el conjunto de datos en varias clases o conjuntos de datos más pequeños.

El conjunto de criterios para seleccionar atributos se denomina Medidas de selección de atributos (ASM). ASM se basa en medidas de selección, incluida la ganancia de información, la entropía, el índice de Gini, la relación de ganancia, etc. Estos atributos, también llamados características, crean reglas de decisión que ayudan en la bifurcación. El proceso de ramificación divide el nodo raíz en subnodos, dividiéndose aún más en más subnodos hasta que se forman los nodos hoja. Los nodos hoja no se pueden dividir más.

Determinar si una imagen dada es la de un gato o la de un perro es un ejemplo típico de clasificación. Aquí, las características o atributos podrían ser la presencia de garras o patas, la longitud de las orejas, el tipo de lengua, etc. El conjunto de datos se dividirá aún más en clases más pequeñas en función de estas variables de entrada hasta que se obtenga el resultado.

Lea también: Clasificación en el árbol de decisión

Conclusión

Los árboles de decisión son modelos de aprendizaje clásicos y naturales. Se basan en el concepto fundamental de divide y vencerás. En el mundo de la inteligencia artificial, los árboles de decisión se utilizan para desarrollar máquinas de aprendizaje enseñándoles cómo determinar el éxito y el fracaso. Estas máquinas de aprendizaje luego analizan los datos entrantes y los almacenan.

Luego, toman innumerables decisiones basadas en experiencias de aprendizaje pasadas. Estas decisiones forman la base para el modelado predictivo que ayuda a predecir los resultados de los problemas. En los negocios, las organizaciones utilizan estas técnicas para tomar innumerables decisiones comerciales pequeñas y grandes que conducen a ganancias o pérdidas gigantes.

Consulte el programa de certificado avanzado de upGrad en aprendizaje automático y PNL. Este curso se ha diseñado teniendo en cuenta varios tipos de estudiantes interesados en el aprendizaje automático, ofrece tutoría 1-1 y mucho más.

¿Qué es un modelo de árbol de decisiones en IA?

Los árboles de decisión existen desde hace mucho tiempo, pero recientemente han ganado prominencia en la comunidad de aprendizaje automático y ciencia de datos. Un árbol de decisiones es un modelo que aprende de los datos y lo ayuda a predecir la clase de un objeto en función de un conjunto de características. Un árbol de decisión es un gráfico acíclico en el que cada nodo representa una prueba en una característica de entrada y cada rama representa el resultado de una prueba. Al atravesar el árbol, el nodo raíz contiene la predicción para todo el árbol.

¿Cuáles son las aplicaciones de los árboles de decisión?

Los modelos se utilizan en varios campos. En biología computacional, a menudo se utilizan para predecir funciones biológicas de proteínas o secuencias de ADN. En epidemiología, se utilizan para determinar el riesgo de transmisión de enfermedades por parte de los individuos afectados. En la minería de datos, se utilizan para predecir eventos futuros en función de eventos anteriores. En finanzas, se usan para determinar el riesgo de incumplimiento y en ingeniería de software, se usan para determinar la prioridad de los defectos del software.

¿Cuáles son los problemas que enfrenta el algoritmo del árbol de decisión?

El mayor problema con los modelos de árboles de decisión es que, en muchos casos, no se enumeran todos los árboles posibles, incluso cuando el número de estados posibles (nodos) es infinito, como en el caso de una puntuación BLEU desconocida. Como sabemos, un árbol de decisión es un algoritmo de aprendizaje automático. Es un árbol de decisión binario. Un árbol donde cada nodo interno representa una prueba en una variable y cada nodo hoja representa una etiqueta de clase. El árbol de decisión tiene que tomar decisiones sobre una tupla de datos en particular. Esta representación no es muy buena cuando se trata de tomar una decisión sobre una variable continua. También tiene una limitación para trabajar con datos que se pueden codificar como una variable categórica.