人工智能中的決策樹:介紹、類型和創建

已發表: 2020-09-03

決策樹是決策過程的外延表示。 人工智能中的決策樹用於根據過去決策中的可用數據得出結論。 此外,這些結論被賦予了價值,用於預測未來可能採取的行動過程。

決策樹是機器學習的統計算法模型,可以解釋和學習各種問題的響應及其可能的後果。 因此,決策樹根據可用數據了解特定上下文中的決策規則。 學習過程是連續的,並且基於反饋。 隨著時間的推移,這會改善學習的結果。 這種學習稱為監督學習。 因此,決策樹模型是監督學習的支持工具。

因此,決策樹提供了基於事實和價值而非直覺的科學決策過程。 在業務中,組織使用此流程來做出重要的業務決策。

學習世界頂尖大學的AI 和 ML 課程獲得碩士、Executive PGP 或高級證書課程以加快您的職業生涯。

目錄

決策樹模型的類型

根據需要預測的數據類型,這些模型可用於解決問題。 它們分為以下幾類:

  1. 連續變量的預測
  2. 分類變量的預測

1. 連續變量的預測

連續變量的預測取決於一個或多個預測變量。 例如,一個地區的房屋價格可能取決於許多變量,例如地址、游泳池等設施的可用性、房間數量等。在這種情況下,決策樹將根據各種變量來預測房屋的價格價值觀。 預測值也將是一個變量值。

用於表示這些值的決策樹模型稱為連續變量決策樹。 連續的各種決策樹解決回歸類型的問題。 在這種情況下,標記數據集用於預測連續、可變和編號的輸出。

必讀:如何創建完美的決策樹

2. 分類變量的預測

分類變量的預測也基於其他分類或連續變量。 然而,這個問題不是預測一個值,而是關於將一個新的數據集分類到可用的數據集類中。 例如,分析 Facebook 上的評論以將文本分類為負面或支持。 根據患者的症狀進行疾病診斷也是分類變量決策樹模型的一個示例。 分類變量決策樹解決了輸出是類而不是值的分類類型問題。

簽出: R中的決策樹

人工智能中的決策樹是如何創建的

顧名思義,決策樹算法是樹狀結構的形式。 然而,它是顛倒的。 決策樹從根節點或頂部決策節點開始,根據精心選擇的屬性值對數據集進行分類。

根節點代表整個數據集。 這是算法的第一步選擇最佳預測變量的地方。 它使它成為一個決策節點。 它還將整個數據集分類為各種類別或較小的數據集。

用於選擇屬性的一組標準稱為屬性選擇措施 (ASM)。 ASM 基於選擇度量,包括信息增益、熵、基尼指數、增益比等。 這些屬性,也稱為特徵,創建有助於分支的決策規則。 分支過程將根節點拆分為子節點,進一步拆分為更多的子節點,直到形成葉節點。 葉節點不能進一步劃分。

確定給定圖片是貓還是狗是分類的典型示例。 在這裡,特徵或屬性可能是爪子或爪子的存在、耳朵的長度、舌頭的類型等。數據集將根據這些輸入變量進一步分成更小的類,直到獲得結果。

另請閱讀:決策樹中的分類

結論

決策樹是經典的自然學習模型。 它們基於分而治之的基本概念。 在人工智能的世界裡,決策樹被用來開發學習機器,教它們如何確定成功和失敗。 這些學習機器然後分析傳入的數據並存儲它。

然後,他們根據過去的學習經驗做出無數決定。 這些決策構成了預測建模的基礎,有助於預測問題的結果。 在商業中,組織使用這些技術來做出無數的小型和大型商業決策,從而導致巨大的收益或損失。

查看 upGrad 的機器學習和 NLP 高級證書課程。 本課程的設計考慮到對機器學習感興趣的各種學生,提供 1-1 指導等等。

什麼是 AI 中的決策樹模型?

決策樹已經存在了很長時間,但最近在機器學習和數據科學界越來越受到重視。 決策樹是一種從數據中學習並幫助您根據一組特徵預測對像類別的模型。 決策樹是一個非循環圖,其中每個節點代表對輸入特徵的測試,每個分支代表測試的結果。 通過向下遍歷樹,根節點包含對整棵樹的預測

決策樹有哪些應用?

這些模型用於多個領域。 在計算生物學中,它們通常用於預測蛋白質或 DNA 序列的生物學功能。 在流行病學中,它們用於確定受影響個體傳播疾病的風險。 在數據挖掘中,它們用於根據以前的事件預測未來的事件。 在金融中,它們用於確定違約風險,在軟件工程中,它們用於確定軟件缺陷的優先級。

決策樹算法面臨哪些問題?

決策樹模型的最大問題是,在許多情況下,即使可能狀態(節點)的數量是無限的,例如在未知 BLEU 分數的情況下,也不會枚舉所有可能的樹。 眾所周知,決策樹是一種機器學習算法。 它是一個二叉決策樹。 一棵樹,其中每個內部節點代表對變量的測試,每個葉節點代表一個類標籤。 決策樹必須對特定的數據元組做出決策。 在對連續變量做出決策時,這種表示不是很好。 此外,它對處理可以編碼為分類變量的數據也有限制。