AIのディシジョンツリー:はじめに、タイプ、作成
公開: 2020-09-03デシジョンツリーは、意思決定プロセスを表すものです。 人工知能の決定木は、過去に行われた決定から入手可能なデータに基づいて結論に到達するために使用されます。 さらに、これらの結論には値が割り当てられ、将来実行される可能性のあるアクションのコースを予測するために展開されます。
デシジョンツリーは、機械学習の統計的でアルゴリズム的なモデルであり、さまざまな問題とその考えられる結果からの応答を解釈して学習します。 その結果、決定木は、利用可能なデータに基づいて、特定のコンテキストでの意思決定のルールを認識します。 学習プロセスは継続的であり、フィードバックに基づいています。 これにより、時間の経過とともに学習の結果が向上します。 この種の学習は、教師あり学習と呼ばれます。 したがって、決定木モデルは教師あり学習のサポートツールです。
したがって、意思決定ツリーは、直感ではなく事実と価値に基づいた科学的な意思決定プロセスを提供します。 ビジネスでは、組織はこのプロセスを使用して重要なビジネス上の意思決定を行います。
世界のトップ大学からAIとMLのコースを学びましょう。 マスター、エグゼクティブPGP、または高度な証明書プログラムを取得して、キャリアを迅速に追跡します。
目次
デシジョンツリーモデルのタイプ
これらのモデルは、予測が必要なデータの種類に応じて問題を解決するために使用できます。 それらは次のカテゴリに分類されます。
- 連続変数の予測
- カテゴリ変数の予測
1.連続変数の予測
連続変数の予測は、1つ以上の予測変数に依存します。 たとえば、ある地域の住宅の価格は、住所、プールなどの設備の利用可能性、部屋の数など、多くの変数に依存する場合があります。この場合、決定ツリーはさまざまな変数に基づいて住宅の価格を予測します。値。 予測値も可変値になります。

このような値を示すために使用される決定木モデルは、連続変数決定木と呼ばれます。 連続的なさまざまな決定木は、回帰タイプの問題を解決します。 このような場合、ラベル付きデータセットは、連続、変数、および番号付きの出力を予測するために使用されます。
必読:完璧な決定木を作成する方法
2.カテゴリ変数の予測
カテゴリ変数の予測は、他のカテゴリ変数または連続変数にも基づいています。 ただし、この問題は、値を予測するのではなく、新しいデータセットを使用可能なデータセットのクラスに分類することに関するものです。 たとえば、Facebookのコメントを分析して、テキストを否定的または支持的として分類します。 患者の症状に基づいて病気の診断を実行することも、カテゴリ変数の決定木モデルの例です。 カテゴリ変数決定木は、出力が値ではなくクラスである分類タイプの問題を解決します。

チェックアウト: Rのディシジョンツリー
人工知能の決定木がどのように作成されるか
名前が示すように、決定木アルゴリズムはツリーのような構造の形式です。 それでも、それは逆になっています。 決定木は、慎重に選択された属性の値に基づいてデータセットを分類するルートまたは最上位の決定ノードから始まります。
ルートノードはデータセット全体を表します。 これは、アルゴリズムの最初のステップで最適な予測変数を選択する場所です。 それは決定ノードになります。 また、データセット全体をさまざまなクラスまたはより小さなデータセットに分類します。
属性を選択するための一連の基準は、属性選択尺度(ASM)と呼ばれます。 ASMは、情報ゲイン、エントロピー、ジニ係数、ゲイン比などの選択指標に基づいています。 これらの属性は機能とも呼ばれ、分岐に役立つ決定ルールを作成します。 分岐プロセスは、ルートノードをサブノードに分割し、リーフノードが形成されるまでさらに多くのサブノードに分割します。 リーフノードをこれ以上分割することはできません。

与えられた写真が猫または犬の写真であるかどうかを判断することは、分類の典型的な例です。 ここで、特徴または属性は、爪または足の存在、耳の長さ、舌のタイプなどである可能性があります。データセットは、結果が得られるまで、これらの入力変数に基づいてさらに小さなクラスに分割されます。
また読む:ディシジョンツリーでの分類
結論
決定木は、古典的で自然な学習モデルです。 それらは分割統治の基本的な概念に基づいています。 人工知能の世界では、決定木を使用して、成功と失敗を判断する方法を学習マシンに教えます。 次に、これらの学習マシンは受信データを分析して保存します。
その後、彼らは過去の学習経験に基づいて無数の決定を下します。 これらの決定は、問題の結果を予測するのに役立つ予測モデリングの基礎を形成します。 ビジネスでは、組織はこれらの手法を使用して、大小のビジネス上の意思決定を無数に行い、大きな利益または損失をもたらします。
機械学習とNLPでupGradの高度な証明書プログラムをチェックアウトします。 このコースは、機械学習に関心のあるさまざまな種類の学生を念頭に置いて作成されており、1-1のメンターシップなどを提供しています。
AIのディシジョンツリーモデルとは何ですか?
デシジョンツリーは長い間存在していましたが、最近、機械学習とデータサイエンスのコミュニティで注目を集めています。 デシジョンツリーは、データから学習し、一連の機能に基づいてオブジェクトのクラスを予測するのに役立つモデルです。 決定木は非巡回グラフであり、各ノードは入力フィーチャのテストを表し、各ブランチはテストの結果を表します。 ツリーをトラバースすることにより、ルートノードにはツリー全体の予測が含まれます
デシジョンツリーの用途は何ですか?
モデルはいくつかの分野で使用されています。 計算生物学では、タンパク質やDNA配列の生物学的機能を予測するためによく使用されます。 疫学では、それらは影響を受けた個人による病気の伝染のリスクを決定するために使用されます。 データマイニングでは、以前のイベントに基づいて将来のイベントを予測するために使用されます。 財務では、デフォルトのリスクを判断するために使用され、ソフトウェアエンジニアリングでは、ソフトウェアの欠陥の優先順位を判断するために使用されます。
デシジョンツリーアルゴリズムが直面する問題は何ですか?
デシジョンツリーモデルの最大の問題は、BLEUスコアが不明な場合など、可能な状態(ノード)の数が無限であっても、多くの場合、すべての可能なツリーが列挙されないことです。 私たちが知っているように、決定木は機械学習アルゴリズムです。 二分決定木です。 各内部ノードが変数のテストを表し、各リーフノードがクラスラベルを表すツリー。 デシジョンツリーは、特定のデータタプルについて決定を下す必要があります。 この表現は、連続変数の決定を行う場合にはあまり良くありません。 また、カテゴリ変数としてエンコードできるデータを処理するための制限があります。