Как создать идеальное дерево решений | Алгоритм дерева решений [с примерами]
Опубликовано: 2020-03-30Если вы задавались вопросом «как создать дерево решений» или «могу ли я создать дерево решений в Java», вы пришли в нужное место. В этой статье мы найдем ответы на такие вопросы, так как будем подробно обсуждать деревья решений. Вы узнаете, что это такое, почему они так популярны и как вы можете создать один из них.
Прежде чем создавать дерево решений, вы должны быть знакомы с несколькими другими темами, такими как линейная регрессия и алгоритмы.
Подробнее: Дерево решений в R
Оглавление
Что такое дерево решений?
Дерево решений дает вам карту всех возможных результатов определенных выборов. Это может помочь вам спланировать будущие действия при различных сценариях в соответствии с различными вариантами выбора. Вы можете сравнить эти возможные результаты на основе их вероятностей и затрат.
Как следует из названия, дерево решений представляет собой граф, напоминающий дерево. Это модель решений, а также результаты и последствия каждого из них. Его конечная цель — помочь вам правильно выполнить классификацию, используя наименьшее количество возможных вариантов.
Вы также можете представлять логические функции с помощью деревьев решений. Каждый листовой узел дерева решений является меткой класса, а внутренние узлы дерева показывают атрибуты. Они начинаются с одного узла, а затем разветвляются на все возможности. Каждая из этих ветвей ведет к большему количеству узлов, которые представляют другие возможные последствия. Вы можете создать дерево решений в Java.

Дерево решений имеет различные типы узлов:
- Узлы принятия решений
- Шанс Узлы
- Конечные узлы
Конечные узлы отражают окончательный результат пути принятия решения, а узлы шансов показывают шансы конкретных результатов. Узлы решений указывают на решение, которое вы примете, которое приведет к возможным результатам. Вы можете использовать деревья решений для составления алгоритмических прогнозов, а также для принятия неформальных решений.
Теперь, когда вы знакомы с тем, что такое дерево решений, мы должны копнуть немного глубже и понять, почему оно распространено. Давайте погрузимся.
Приложения дерева решений
Вот несколько применений деревьев решений, чтобы вы могли увидеть, насколько они распространены:
- Банки используют их для классификации своих кредитных заявок.
- Специалисты по финансам используют деревья решений для оценки опционов
- Классификация экзаменационных работ в зависимости от уровня знаний кандидатов
- Выбор, принять или отклонить предложение о работе
- Принятие важных бизнес-решений, например, следует ли компании модифицировать свой продукт или нет.
Вы, должно быть, сами использовали деревья решений, делая различные выборы в своей жизни. Просто придумайте несколько сценариев, в которых вам нужно было принять сложное решение.
Преимущества дерева решений
Использование дерева решений имеет много преимуществ. Вот они:
- Деревья решений создают правила, которые вам легко понять. Вам не составит труда передать эти правила другим системам.
- Они могут обрабатывать как категориальные, так и непрерывные переменные.
- Дерево решений даст вам простое представление о важности каждого поля. Вы можете легко делать прогнозы (или классификации) в соответствии с тем же.
- Деревья решений также неявно выполняют выбор функций, что помогает вам в исследовании данных.
Узнать больше: Алгоритмы искусственного интеллекта

Недостатки дерева решений
У всего есть свои недостатки, и деревья решений не исключение. Вот некоторые проблемы с их использованием:
- Деревья решений бесполезны для выполнения задач оценки. Это связано с тем, что такие задания требуют предсказания непрерывного значения атрибута, а деревья решений не годятся для этого.
- В вычислительном отношении деревья решений обходятся дороже, чем другие варианты. Обучение модели дерева решений также будет стоить вам дорого по сравнению с другими. Алгоритмы обрезки, которые вы использовали бы при создании деревьев решений, также довольно дороги, поскольку они требуют построения множества поддеревьев.
- Если у вас есть большое количество примеров классов, но небольшое количество обучающих примеров, ваши деревья решений не будут очень точными, и их шансы содержать ошибки будут значительно выше.
Как создать дерево решений
Давайте создадим дерево решений о том, будет ли человек покупать компьютер или нет. В этом случае у нас будет два класса: «Да» и «Нет». К первому классу относятся люди, которые купят компьютер, а ко второму — те, кто этого не сделает. Сначала мы рассчитаем прирост информации и энтропию для этих классов.
Как только мы вычислим энтропию этих классов, мы сосредоточимся на получении информации. Мы можем классифицировать значения энтропии следующим образом:
Если энтропия равна 0, это означает, что данные чистые (однородные).
Если энтропия равна 1, это означает, что данные нечисты (половина).
Предположим, что наша энтропия нечиста. Затем мы разделим прирост информации по возрасту. Таким образом, наши данные покажут, сколько людей определенной возрастной группы купят этот продукт, а сколько нет. Мы можем рассчитать прирост информации для нескольких атрибутов. Но в нашем примере мы обнаружили, что прирост информации самый высокий для «Возраст» и самый низкий для «Доход». Итак, мы пойдем с этим.
Вот правила классификации для этого дерева решений:
Если чей-то возраст меньше 30 лет и этот человек не студент, он не будет покупать продукт, поэтому:
Возраст (<30) ^ студент (нет) = НЕТ
Но если кто-то, чей возраст меньше 30 лет и является студентом, он купит продукт:
Возраст (<30)^ студент (да) = ДА
Теперь, если их возраст находится между 31 и 40 годами, они обязательно купят продукт:
Возраст(31…40) = ДА
Человек старше 40 лет и с высоким кредитным рейтингом не стал бы покупать:
Возраст (> 40) ^ кредит_рейтинг (высокий) = НЕТ
С другой стороны, если человек старше 40 лет, но имеет средний кредитный рейтинг, он или она купит продукт:

Возраст (> 40) ^ кредит_рейтинг (нормальный) = ДА
Следуя этим шагам, вы сможете без труда создать идеальное дерево решений .
Узнайте больше о: 9 лучших библиотеках машинного обучения, о которых вы должны знать
Заключение
Теперь вы должны знать, как создать дерево решений. Вы можете узнать намного больше о деревьях решений и соответствующих алгоритмах в нашем курсе машинного обучения. Мы уверены, что вы улучшите свои знания, поскольку узнаете, как создать дерево решений в Java, как вы можете использовать его в реальной жизни и многое другое.
Если вам интересно узнать больше о машинном обучении, ознакомьтесь с дипломом PG IIIT-B и upGrad в области машинного обучения и искусственного интеллекта, который предназначен для работающих профессионалов и предлагает более 450 часов тщательного обучения, более 30 тематических исследований и заданий, IIIT- Статус B Alumni, более 5 практических практических проектов и помощь в трудоустройстве в ведущих фирмах.