Дерево решений в ИИ: введение, типы и создание

Опубликовано: 2020-09-03

Дерево решений — это денотативное представление процесса принятия решений. Деревья решений в искусственном интеллекте используются для того, чтобы делать выводы на основе данных, доступных из решений, принятых в прошлом. Кроме того, этим выводам присваиваются значения, используемые для предсказания курса действий, который, вероятно, будет предпринят в будущем.

Деревья решений — это статистические алгоритмические модели машинного обучения, которые интерпретируют и изучают ответы на различные проблемы и их возможные последствия. В результате деревья решений знают правила принятия решений в конкретных контекстах на основе доступных данных. Процесс обучения непрерывен и основан на обратной связи. Это улучшает результаты обучения с течением времени. Такой вид обучения называется контролируемым обучением. Таким образом, модели деревьев решений являются вспомогательными инструментами для обучения с учителем.

Таким образом, деревья решений обеспечивают научный процесс принятия решений, основанный на фактах и ​​ценностях, а не на интуиции. В бизнесе организации используют этот процесс для принятия важных бизнес-решений.

Изучите курсы по искусственному интеллекту и машинному обучению в лучших университетах мира. Заработайте программы Masters, Executive PGP или Advanced Certificate Programs, чтобы ускорить свою карьеру.

Оглавление

Тип моделей дерева решений

Эти модели можно использовать для решения проблем в зависимости от типа данных, требующих прогнозирования. Они относятся к следующим категориям:

  1. Прогнозирование непрерывных переменных
  2. Прогнозирование категориальных переменных

1. Прогнозирование непрерывных переменных

Предсказание непрерывных переменных зависит от одного или нескольких предикторов. Например, цены на дома в районе могут зависеть от многих переменных, таких как адрес, наличие удобств, таких как бассейн, количество комнат и т. д. В этом случае дерево решений будет прогнозировать цену дома на основе различных переменных. значения. Прогнозируемое значение также будет переменным значением.

Модель дерева решений, используемая для указания таких значений, называется деревом решений с непрерывными переменными. Непрерывные различные деревья решений решают задачи регрессионного типа. В таких случаях помеченные наборы данных используются для прогнозирования непрерывного, переменного и нумерованного вывода.

Обязательно прочтите: Как создать идеальное дерево решений

2. Прогнозирование категориальных переменных

Предсказание категориальных переменных также основано на других категориальных или непрерывных переменных. Однако вместо прогнозирования значения эта проблема заключается в классификации нового набора данных по доступным классам наборов данных. Например, анализ комментария на Facebook для классификации текста как отрицательного или поддерживающего. Выполнение диагностики болезни на основе симптомов пациента также является примером модели дерева решений с категориальными переменными. Деревья решений категориальных переменных решают задачи типа классификации, где результатом является класс, а не значение.

Проверьте: Дерево решений в R

Как создаются деревья решений в искусственном интеллекте

Как следует из названия, алгоритм дерева решений имеет форму древовидной структуры. Тем не менее, он перевернут. Дерево решений начинается с корня или верхнего узла решений, который классифицирует наборы данных на основе значений тщательно отобранных атрибутов.

Корневой узел представляет весь набор данных. Именно здесь на первом этапе алгоритма выбирается наилучшая предикторная переменная. Это делает его узлом принятия решений. Он также классифицирует весь набор данных по различным классам или меньшим наборам данных.

Набор критериев для выбора атрибутов называется мерами выбора атрибутов (ASM). ASM основан на показателях отбора, включая прирост информации, энтропию, индекс Джини, коэффициент усиления и так далее. Эти атрибуты, также называемые функциями, создают правила принятия решений, которые помогают в ветвлении. Процесс ветвления разбивает корневой узел на подузлы, далее разбивая их на большее количество подузлов, пока не будут сформированы конечные узлы. Листовые узлы не могут быть разделены дальше.

Определение того, является ли данное изображение изображением кошки или собаки, является типичным примером классификации. Здесь признаками или атрибутами могут быть наличие когтей или лап, длина ушей, тип языка и т. д. Набор данных будет далее разбит на более мелкие классы на основе этих входных переменных, пока не будет получен результат.

Читайте также: Классификация в дереве решений

Заключение

Деревья решений — это классические и естественные модели обучения. Они основаны на фундаментальной концепции «разделяй и властвуй». В мире искусственного интеллекта деревья решений используются для разработки обучающихся машин, обучая их тому, как определять успех и неудачу. Затем эти обучающиеся машины анализируют входящие данные и сохраняют их.

Затем они принимают бесчисленные решения, основанные на прошлом учебном опыте. Эти решения составляют основу прогнозного моделирования, которое помогает прогнозировать результаты решения проблем. В бизнесе организации используют эти методы для принятия бесчисленных решений в малом и крупном бизнесе, ведущих к гигантским прибылям или убыткам.

Ознакомьтесь с расширенной сертификационной программой upGrad в области машинного обучения и НЛП. Этот курс был разработан с учетом различных типов студентов, заинтересованных в машинном обучении, предлагая индивидуальное наставничество и многое другое.

Что такое модель дерева решений в ИИ?

Деревья решений существуют уже давно, но в последнее время они приобретают все большее значение в сообществе машинного обучения и науки о данных. Дерево решений — это модель, которая учится на данных и помогает вам предсказать класс объекта на основе набора функций. Дерево решений — это ациклический граф, в котором каждый узел представляет собой проверку входного признака, а каждая ветвь — результат проверки. При обходе дерева корневой узел содержит прогноз для всего дерева.

Каковы приложения деревьев решений?

Модели используются в нескольких областях. В вычислительной биологии они часто используются для предсказания биологических функций белков или последовательностей ДНК. В эпидемиологии они используются для определения риска передачи болезни пораженными людьми. В интеллектуальном анализе данных они используются для прогнозирования будущих событий на основе предыдущих событий. В финансах они используются для определения риска дефолта, а в программной инженерии — для определения приоритета дефектов программного обеспечения.

С какими проблемами сталкивается алгоритм дерева решений?

Самая большая проблема с моделями деревьев решений заключается в том, что во многих случаях не перечисляются все возможные деревья, даже когда количество возможных состояний (узлов) бесконечно, например, в случае неизвестного показателя BLEU. Как мы знаем, дерево решений — это алгоритм машинного обучения. Это бинарное дерево решений. Дерево, в котором каждый внутренний узел представляет тест переменной, а каждый конечный узел представляет собой метку класса. Дерево решений должно принимать решения по конкретному кортежу данных. Это представление не очень хорошо, когда дело доходит до принятия решения о непрерывной переменной. Также у него есть ограничение на работу с данными, которые могут быть закодированы как категориальная переменная.