如何創建完美的決策樹 | 決策樹算法[附例子]
已發表: 2020-03-30如果您想知道“如何創建決策樹”或“我可以在 Java 中創建決策樹”,那麼您來對地方了。 在本文中,我們將找到這些問題的答案,因為我們將詳細討論決策樹。 您將了解它們是什麼,為什麼它們如此受歡迎,以及如何創建它們。
在創建決策樹之前,您必須熟悉其他幾個主題,例如線性回歸和算法。
閱讀更多: R中的決策樹
目錄
什麼是決策樹?
決策樹為您提供了特定選擇的所有可能結果的地圖。 它可以幫助您根據不同的選擇規劃不同場景下的未來行動。 您可以根據概率和成本來比較這些可能的結果。
顧名思義,決策樹顯示了一個類似於樹的圖形。 它是一個決策模型,以及每個決策的結果和後果。 其最終目標是幫助您正確執行分類,同時盡可能少地進行選擇。
您也可以使用決策樹來表示布爾函數。 決策樹的每個葉子節點都是一個類標籤,樹的內部節點顯示屬性。 它們從一個節點開始,然後分支到所有可能性。 這些分支中的每一個都會導致更多節點,這些節點代表其他可能的後果。 您可以在 Java 中創建決策樹。

決策樹有多種節點:
- 決策節點
- 機會節點
- 結束節點
末端節點反映決策路徑的最終結果,而機會節點則顯示特定結果的機會。 決策節點表示您將做出的將導致可能結果的決策。 您可以使用決策樹來繪製算法預測以及做出非正式決策。
現在您已經熟悉了決策樹是什麼,我們應該專注於更深入地挖掘並了解它為何如此普遍。 讓我們潛入水中。
決策樹的應用
以下是決策樹的一些應用,您可以了解它們的流行程度:
- 銀行使用它們對貸款申請進行分類
- 金融專業人士使用決策樹進行期權定價
- 根據考生的專業水平對試捲進行分類
- 選擇是接受還是拒絕工作機會
- 做出重要的業務決策,例如公司是否應該修改其產品。
您自己在生活中做出各種選擇時一定使用過決策樹。 只要想出一些你必須做出複雜決定的場景。
決策樹的優勢
使用決策樹有很多優點。 他們是這樣的:
- 決策樹會生成您可以輕鬆理解的規則。 將這些規則傳達給其他系統不會有任何困難。
- 他們可以處理分類變量和連續變量
- 決策樹將為您提供每個領域重要性的簡單指示。 您可以根據相同的內容輕鬆進行預測(或分類)。
- 決策樹還隱式執行特徵選擇,幫助您進行數據探索。
了解更多:人工智能算法

決策樹的缺點
任何事物都有其缺陷,決策樹也不例外。 以下是使用它們的一些問題:
- 決策樹對於執行估計任務沒有用處。 這是因為此類工作需要預測連續屬性的值,而決策樹並不擅長於此。
- 在計算上,決策樹比其他選項更昂貴。 與其他模型相比,訓練決策樹模型也會花費很多。 您在製作決策樹時使用的修剪算法也非常昂貴,因為它們需要構建許多子樹。
- 如果您有大量的類示例但訓練示例的數量很少,那麼您的決策樹將不會很準確,並且它們包含錯誤的機會會非常高。
如何創建決策樹
讓我們創建一個關於一個人是否會購買計算機的決策樹。 在這種情況下,我們將有兩個類,“是”和“否”。 第一類是指會買電腦的人,第二類是指不會買電腦的人。 首先,我們將計算這些類的信息增益和熵。
一旦我們計算了這些類的熵,我們將專注於信息增益。 我們可以像這樣對熵的值進行分類:
如果 Entropy 為 0,則表示數據是純的(同質的)
如果 Entropy 為 1,則表示數據不純(半除)
假設我們的熵是不純的。 然後我們將按年齡劃分信息增益。 這樣,我們的數據將顯示有多少特定年齡段的人會購買該產品,而有多少人不會。 我們可以計算多個屬性的信息增益。 但在我們的示例中,我們發現“年齡”的信息增益最高,“收入”的信息增益最低。 所以,我們會去的。
以下是此決策樹的分類規則:
如果某人的年齡小於 30 歲並且該人不是學生,則他們不會購買該產品,因此:
年齡 (<30) ^ 學生(否)= 否
但是,如果有人年齡小於 30 並且是學生,他們會購買該產品:
年齡(<30)^ 學生(是)= 是
現在,如果他們的年齡介於 31 到 40 歲之間,他們肯定會購買該產品:
年齡(31…40)= 是
40 歲以上且信用評級高的人不會購買:
年齡(>40)^ credit_rating(high) = NO
另一方面,如果一個人年齡超過 40 歲但信用評級一般,他或她會購買該產品:

年齡(>40)^ credit_rating(正常) = YES
按照這些步驟,您將能夠毫無困難地創建完美的決策樹。
了解更多:您應該了解的 9 大機器學習庫
結論
現在您必須知道如何創建決策樹。 您可以在我們的機器學習課程中了解更多關於決策樹和相關算法的信息。 我們確信您將在那裡增強您的知識,因為您將學習如何在 Java 中創建決策樹,如何在現實生活中使用它們等等。
如果您有興趣了解有關機器學習的更多信息,請查看 IIIT-B 和 upGrad 的機器學習和人工智能 PG 文憑,該文憑專為工作專業人士設計,提供 450 多個小時的嚴格培訓、30 多個案例研究和作業、IIIT- B 校友身份、5 個以上實用的實踐頂點項目和頂級公司的工作協助。