AI의 의사 결정 트리: 소개, 유형 및 생성

게시 됨: 2020-09-03

의사 결정 트리는 의사 결정 프로세스를 나타내는 표현입니다. 인공 지능의 의사 결정 트리는 과거의 의사 결정에서 얻을 수 있는 데이터를 기반으로 결론에 도달하는 데 사용됩니다. 또한 이러한 결론에는 값이 할당되어 향후 취해질 수 있는 조치를 예측할 수 있습니다.

의사 결정 트리는 다양한 문제와 가능한 결과로부터 응답을 해석하고 학습하는 통계적, 알고리즘적 기계 학습 모델입니다. 결과적으로 의사 결정 트리는 사용 가능한 데이터를 기반으로 특정 컨텍스트에서 의사 결정 규칙을 알고 있습니다. 학습 과정은 지속적이며 피드백을 기반으로 합니다. 이것은 시간이 지남에 따라 학습의 결과를 향상시킵니다. 이런 종류의 학습을 지도 학습(supervised learning)이라고 합니다. 따라서 의사 결정 트리 모델은 지도 학습을 위한 지원 도구입니다.

따라서 의사결정나무는 직관보다는 사실과 가치에 기반한 과학적 의사결정 과정을 제공합니다. 비즈니스에서 조직은 이 프로세스를 사용하여 중요한 비즈니스 결정을 내립니다.

세계 최고의 대학에서 AI 및 ML 과정 을 배우십시오 . 석사, 이그 제 큐 티브 PGP 또는 고급 인증 프로그램을 획득하여 경력을 빠르게 추적하십시오.

의사결정나무 모델의 유형

이러한 모델은 예측이 필요한 데이터의 종류에 따라 문제를 해결하는 데 사용할 수 있습니다. 다음 범주에 속합니다.

연속변수 예측
범주형 변수의 예측

1. 연속변수 예측

연속 변수의 예측은 하나 이상의 예측 변수에 따라 다릅니다. 예를 들어, 한 지역의 집 가격은 주소, 수영장과 같은 편의 시설의 가용성, 방 수 등과 같은 많은 변수에 따라 달라질 수 있습니다. 이 경우 의사 결정 트리는 다양한 변수를 기반으로 집의 가격을 예측합니다. 가치. 예측 값도 변수 값이 됩니다.

이러한 값을 나타내는 데 사용되는 결정 트리 모델을 연속 변수 결정 트리라고 합니다. 연속적인 다양한 의사 결정 트리는 회귀 유형 문제를 해결합니다. 이러한 경우 레이블이 지정된 데이터 세트를 사용하여 연속, 변수 및 번호가 매겨진 출력을 예측합니다.

반드시 읽어야 할 것: 완벽한 의사 결정 트리를 만드는 방법

2. 범주형 변수의 예측

범주형 변수의 예측은 다른 범주형 또는 연속형 변수도 기반으로 합니다. 그러나 이 문제는 값을 예측하는 대신 새 데이터 세트를 사용 가능한 데이터 세트 클래스로 분류하는 것입니다. 예를 들어 Facebook의 댓글을 분석하여 텍스트를 부정적이거나 지지적인 것으로 분류합니다. 환자의 증상을 기반으로 질병 진단을 수행하는 것도 범주형 변수 결정 트리 모델의 한 예입니다. 범주형 변수 결정 트리는 출력이 값이 아닌 클래스인 분류 유형 문제를 해결합니다.

확인: R의 의사결정나무

인공 지능의 의사 결정 트리가 생성되는 방법

이름에서 알 수 있듯이 의사 결정 트리 알고리즘은 트리와 같은 구조의 형태입니다. 그런데도 거꾸로 되어 있습니다. 의사 결정 트리는 신중하게 선택한 속성의 값을 기반으로 데이터 세트를 분류하는 최상위 의사 결정 노드 또는 루트에서 시작합니다.

루트 노드는 전체 데이터 세트를 나타냅니다. 여기에서 알고리즘의 첫 번째 단계에서 최상의 예측 변수를 선택합니다. 결정 노드로 만듭니다. 또한 전체 데이터 세트를 다양한 클래스 또는 더 작은 데이터 세트로 분류합니다.

속성을 선택하기 위한 기준 집합을 속성 선택 측정(ASM)이라고 합니다. ASM은 정보 이득, 엔트로피, 지니 지수, 이득 비율 등을 포함한 선택 측정을 기반으로 합니다. 기능이라고도 하는 이러한 속성은 분기에 도움이 되는 결정 규칙을 생성합니다. 분기 프로세스는 루트 노드를 하위 노드로 분할하고 리프 노드가 형성될 때까지 더 많은 하위 노드로 분할합니다. 리프 노드는 더 이상 나눌 수 없습니다.

주어진 사진이 고양이인지 강아지인지 판별하는 것은 분류의 전형적인 예입니다. 여기에서 특징이나 속성은 발톱이나 발의 존재, 귀의 길이, 혀의 유형 등이 될 수 있습니다. 데이터 세트는 결과를 얻을 때까지 이러한 입력 변수를 기반으로 더 작은 클래스로 분할됩니다.

더 읽어보기: 의사결정나무의 분류

결론

의사결정나무는 고전적이고 자연스러운 학습 모델입니다. 그들은 분할 정복의 기본 개념을 기반으로 합니다. 인공 지능의 세계에서 의사 결정 트리는 성공과 실패를 결정하는 방법을 가르쳐 학습 기계를 개발하는 데 사용됩니다. 그런 다음 이러한 학습 기계는 들어오는 데이터를 분석하고 저장합니다.

그런 다음 그들은 과거의 학습 경험을 바탕으로 수많은 결정을 내립니다. 이러한 결정은 문제에 대한 결과를 예측하는 데 도움이 되는 예측 모델링의 기초를 형성합니다. 비즈니스에서 조직은 이러한 기술을 사용하여 막대한 이익 또는 손실로 이어지는 수많은 크고 작은 비즈니스 결정을 내립니다.

기계 학습 및 NLP에서 upGrad의 고급 인증 프로그램을 확인하십시오. 이 과정은 기계 학습에 관심이 있는 다양한 유형의 학생들을 염두에 두고 제작되었으며 1-1 멘토링 등을 제공합니다.

AI의 의사 결정 트리 모델이란 무엇입니까?

의사결정나무는 오래전부터 존재해 왔지만 최근에는 기계 학습 및 데이터 과학 커뮤니티에서 두각을 나타내고 있습니다. 의사 결정 트리는 데이터에서 학습하고 기능 집합을 기반으로 개체의 클래스를 예측하는 데 도움이 되는 모델입니다. 의사 결정 트리는 각 노드가 입력 기능에 대한 테스트를 나타내고 각 분기가 테스트 결과를 나타내는 비순환 그래프입니다. 트리를 탐색하여 루트 노드에는 전체 트리에 대한 예측이 포함됩니다.

의사 결정 트리의 응용 프로그램은 무엇입니까?

모델은 여러 분야에서 사용됩니다. 컴퓨터 생물학에서는 단백질이나 DNA 서열의 생물학적 기능을 예측하는 데 자주 사용됩니다. 역학에서는 영향을 받는 개인에 의한 질병 전파 위험을 결정하는 데 사용됩니다. 데이터 마이닝에서는 이전 이벤트를 기반으로 미래 이벤트를 예측하는 데 사용됩니다. 재무에서는 채무 불이행 위험을 결정하는 데 사용되며 소프트웨어 엔지니어링에서는 소프트웨어 결함의 우선 순위를 결정하는 데 사용됩니다.

의사 결정 트리 알고리즘이 직면한 문제는 무엇입니까?

의사 결정 트리 모델의 가장 큰 문제는 BLEU 점수를 알 수 없는 경우와 같이 가능한 상태(노드)의 수가 무한하더라도 가능한 모든 트리를 열거하지 않는 경우가 많다는 것입니다. 우리가 알고 있듯이 의사 결정 트리는 기계 학습 알고리즘입니다. 이진 결정 트리입니다. 각 내부 노드가 변수에 대한 테스트를 나타내고 각 리프 노드가 클래스 레이블을 나타내는 트리입니다. 의사 결정 트리는 특정 데이터 튜플에 대한 결정을 내려야 합니다. 이 표현은 연속 변수에 대한 결정을 내릴 때 그다지 좋지 않습니다. 또한 범주형 변수로 인코딩할 수 있는 데이터에 대해 작업하는 데 제한이 있습니다.