如何创建完美的决策树 | 决策树算法[附例子]

已发表: 2020-03-30

如果您想知道“如何创建决策树”或“我可以在 Java 中创建决策树”,那么您来对地方了。 在本文中,我们将找到这些问题的答案,因为我们将详细讨论决策树。 您将了解它们是什么,为什么它们如此受欢迎,以及如何创建它们。

在创建决策树之前,您必须熟悉其他几个主题,例如线性回归和算法。

阅读更多: R中的决策树

目录

什么是决策树?

决策树为您提供了特定选择的所有可能结果的地图。 它可以帮助您根据不同的选择规划不同场景下的未来行动。 您可以根据概率和成本来比较这些可能的结果。

顾名思义,决策树显示了一个类似于树的图形。 它是一个决策模型,以及每个决策的结果和后果。 其最终目标是帮助您正确执行分类,同时尽可能少地进行选择。

您也可以使用决策树来表示布尔函数。 决策树的每个叶子节点都是一个类标签,树的内部节点显示属性。 它们从一个节点开始,然后分支到所有可能性。 这些分支中的每一个都会导致更多节点,这些节点代表其他可能的后果。 您可以在 Java 中创建决策树。

决策树有多种节点:

  • 决策节点
  • 机会节点
  • 结束节点

末端节点反映决策路径的最终结果,而机会节点则显示特定结果的机会。 决策节点表示您将做出的将导致可能结果的决策。 您可以使用决策树来绘制算法预测以及做出非正式决策。

现在您已经熟悉了决策树是什么,我们应该专注于更深入地挖掘并了解它为何如此普遍。 让我们潜入水中。

决策树的应用

以下是决策树的一些应用,您可以了解它们的流行程度:

  • 银行使用它们对贷款申请进行分类
  • 金融专业人士使用决策树进行期权定价
  • 根据考生的专业水平对试卷进行分类
  • 选择是接受还是拒绝工作机会
  • 做出重要的业务决策,例如公司是否应该修改其产品。

您自己在生活中做出各种选择时一定使用过决策树。 只要想出一些你必须做出复杂决定的场景。

决策树的优势

使用决策树有很多优点。 他们是这样的:

  • 决策树会生成您可以轻松理解的规则。 将这些规则传达给其他系统不会有任何困难。
  • 他们可以处理分类变量和连续变量
  • 决策树将为您提供每个领域重要性的简单指示。 您可以根据相同的内容轻松进行预测(或分类)。
  • 决策树还隐式执行特征选择,帮助您进行数据探索。

了解更多:人工智能算法

决策树的缺点

任何事物都有其缺陷,决策树也不例外。 以下是使用它们的一些问题:

  • 决策树对于执行估计任务没有用处。 这是因为此类工作需要预测连续属性的值,而决策树并不擅长于此。
  • 在计算上,决策树比其他选项更昂贵。 与其他模型相比,训练决策树模型也会花费很多。 您在制作决策树时使用的修剪算法也非常昂贵,因为它们需要构建许多子树。
  • 如果您有大量的类示例但训练示例的数量很少,那么您的决策树将不会很准确,并且它们包含错误的机会会非常高。

如何创建决策树

让我们创建一个关于一个人是否会购买计算机的决策树。 在这种情况下,我们将有两个类,“是”和“否”。 第一类是指会买电脑的人,第二类是指不会买电脑的人。 首先,我们将计算这些类的信息增益和熵。

一旦我们计算了这些类的熵,我们将专注于信息增益。 我们可以像这样对熵的值进行分类:

如果 Entropy 为 0,则表示数据是纯的(同质的)

如果 Entropy 为 1,则表示数据不纯(半除)

假设我们的熵是不纯的。 然后我们将按年龄划分信息增益。 这样,我们的数据将显示有多少特定年龄段的人会购买该产品,而有多少人不会。 我们可以计算多个属性的信息增益。 但在我们的示例中,我们发现“年龄”的信息增益最高,“收入”的信息增益最低。 所以,我们会去的。

以下是此决策树的分类规则:

如果某人的年龄小于 30 岁并且该人不是学生,则他们不会购买该产品,因此:

年龄 (<30) ^ 学生(否)= 否

但是,如果有人年龄小于 30 并且是学生,他们会购买该产品:

年龄(<30)^ 学生(是)= 是

现在,如果他们的年龄介于 31 到 40 岁之间,他们肯定会购买该产品:

年龄(31…40)= 是

40 岁以上且信用评级高的人不会购买:

年龄(>40)^ credit_rating(high) = NO

另一方面,如果一个人年龄超过 40 岁但信用评级一般,他或她会购买该产品:

年龄(>40)^ credit_rating(正常) = YES

按照这些步骤,您将能够毫无困难地创建完美的决策树

了解更多:您应该了解的 9 大机器学习库

结论

现在您必须知道如何创建决策树。 您可以在我们的机器学习课程中了解更多关于决策树和相关算法的信息。 我们确信您将在那里增强您的知识,因为您将学习如何在 Java 中创建决策树,如何在现实生活中使用它们等等。

如果您有兴趣了解有关机器学习的更多信息,请查看 IIIT-B 和 upGrad 的机器学习和人工智能 PG 文凭,该文凭专为工作专业人士设计,提供 450 多个小时的严格培训、30 多个案例研究和作业、IIIT- B 校友身份、5 个以上实用的实践顶点项目和顶级公司的工作协助。

引领人工智能驱动的技术革命

机器学习和人工智能的 PG 文凭
现在申请