Karar Ağacı Algoritması Kılavuzu: Uygulamalar, Artılar ve Eksiler ve Örnekler

Yayınlanan: 2020-12-10

Çeşitli Makine Öğrenimi algoritmaları vardır ve her birinin benzersiz uygulamaları vardır. Bu yazıda, en popüler ve kullanışlı ML algoritmalarından biri olan Karar Ağacı algoritmasına göz atacağız. Kullanımına aşina olmanıza yardımcı olmak için R'deki Karar ağacının bir örneğini tartıştık. Başlayalım.

İçindekiler

Karar Ağacı Algoritması Nedir?

Karar Ağacı, bir kök düğümü ve yaprak düğümleri olan bir tür denetimli makine öğrenimi algoritmasıdır. Her düğüm bir özelliği temsil eder ve düğümler arasındaki bağlantılar kararı gösterir. Her yaprak bir sonucu temsil eder.

Diyelim ki sebze almak için pazara gitmek istiyorsunuz. İki seçeneğiniz var: ya gidersiniz ya da gitmezsiniz. Gitmezseniz sebzeleri alamayacaksınız, ancak giderseniz pazara gitmeniz gerekecek, bu da başka bir seçim bölümüne yol açıyor. Bir karar ağacı aynen bu şekilde çalışır.

Karar Ağaçları Uygulamaları

İşte karar ağaçlarının bazı uygulamaları:

Pazarlama:

İşletmeler, rakiplerinin ürün ve hizmetlerinin performansını gözlemleyerek tanıtım kampanyalarının doğruluğunu artırmak için karar ağaçlarını kullanabilirler. Karar ağaçları, hedef kitle segmentasyonuna yardımcı olabilir ve işletmeleri daha yüksek dönüşüm oranlarına sahip daha iyi hedeflenmiş reklamlar üretmede destekleyebilir.

Müşterilerin Elde Tutulması:

Şirketler, davranışlarını analiz ederek ve bu davranışlara uygun yeni teklifler veya ürünler sunarak müşteriyi elde tutmak için karar ağaçlarını kullanır. Şirketler, karar ağacı modellerini kullanarak müşterilerinin memnuniyet düzeylerini de hesaplayabilirler.

Hastalık ve Rahatsızlıkların Teşhisi:

Karar ağaçları, diyabet veya bunama gibi ciddi (veya önlenebilir) durumlar geliştirme riski daha yüksek olan hastaları belirlemede doktorlara ve tıp uzmanlarına yardımcı olabilir. Karar ağaçlarının belirli değişkenlere göre olasılıkları daraltma yeteneği, bu gibi durumlarda oldukça faydalıdır.

Dolandırıcılık Tespiti:

Şirketler, hileli davranışları önceden belirlemek için karar ağaçlarını kullanarak sahtekarlığı önleyebilir. Şirketlere zaman ve para da dahil olmak üzere birçok kaynak tasarrufu sağlayabilir.

Karar Ağaçlarının Avantaj ve Dezavantajları

Karar Ağacı Algoritmasının Avantajları:

R'de bir karar ağacı kullanmanın başlıca avantajları şunlardır:

Sonuçları anlamak diğer modellere göre daha kolaydır. Teknik ekibin karar ağacı modelinizi programlamasını sağlayabilirsiniz, böylece daha hızlı çalışır ve yeni örneklere uygulayabilirsiniz. Hesaplamaları, nitel veya nicel bir model olan bir örneğe göre dahil etme testlerine sahiptir.
Parametrik değildir. Bu nedenle problemimizde bulunan bağımsız değişkenler belirli bir olasılık dağılımını takip etmek zorunda değildir. Doğrusal değişkenlere sahip olabilirsiniz. Ayrımcı olsun ya da olmasın, bu değişkenleri seçmek zorunda olmadığı için karar ağacınıza bir etkisi olmaz.
Eksik değerlerle çalışabilirler. CHAID, eksik olan tüm değerleri bir başka kategoriyle birleştirebileceğiniz veya diğerlerinden ayrı tutabileceğiniz bir kategoriye koyar.
Aşırı bireysel değerlerin (aykırı değerler gibi) karar ağaçları üzerinde fazla bir etkisi yoktur. Tüm sınıflandırmayı etkilememeleri için bunları küçük düğümlerde ayırabilirsiniz.
Size bir karar verme sürecinin harika bir görsel temsilini sunar. Bir karar ağacının her dalı, kararlarınızı etkileyebilecek faktörleri temsil eder ve daha büyük bir resim görürsünüz. Ekibinizdeki iletişimi geliştirmek için karar ağaçlarını kullanabilirsiniz.
CART ağaçları, nitel, sürekli ve ayrık değişkenler dahil olmak üzere tüm değişken türlerini doğrudan işleyebilir.

Karar Ağacı Algoritmasının Dezavantajları

Tüm bağımsız değişkenleri aynı anda analiz etmez. Bunun yerine, bunları sırayla değerlendirir. Bu nedenle, ağaç, herhangi bir düzeyde bir düğümün bölünmesini asla revize etmez, bu da ağacın seçimlerinde yanlılığa neden olabilir.
Tek bir değişkeni değiştirmek bile, tepeye yakınsa tüm ağacı etkileyebilir. Bu sorunu çözmenin yolları var. Örneğin, ağacı birden fazla örnek üzerinde oluşturabilir ve bunları bir ortalamaya (veya oylamaya) göre toplayabilirsiniz; buna yeniden örnekleme denir. Ancak, modeli daha karmaşık hale getirerek okunabilirliğini azalttığı için başka bir dizi soruna yol açar. Böylece yeniden örnekleme yoluyla karar ağaçlarının en iyi özelliklerinden kurtulabilirsiniz. O niçin bir problem olsun ki? Bir değişkenin belirli bir grubun tüm niteliklerine sahip olduğunu, ancak aynı zamanda ağacın bölündüğü kaliteye de sahip olduğunu varsayalım. Bu durumda, ağaç sırf o önemli kaliteye sahip olduğu için onu yanlış sınıfa koyacaktır.
Bir karar ağacındaki belirli bir düzeyin tüm düğümleri, önceki düzeylerindeki düğümlere bağlıdır. Başka bir deyişle, 'n +1' düzeyindeki düğümleri nasıl tanımladığınız, tamamen 'n' düzeyindeki düğümler için tanımınıza bağlıdır. Eğer 'n' seviyesindeki tanımınız yanlışsa, sonraki tüm seviyeler ve bu seviyelerde bulunan düğümler de yanlış olacaktır.

Öğrenin: Makine Öğreniminde Doğrusal Regresyon

R'de Karar Ağacı (Örnek)

R'de bir karar ağacı oluşturmak için rpart'a ihtiyacınız olacak. Sınıflandırma için rpart kullanıyoruz. R'de, bir karar üreten özyinelemeli bölümleme algoritması ve bununla birlikte regresyon ağaçları temelinde bir karar ağacı oluşturursunuz. İki adımı vardır:

İlk olarak, verileri mümkün olan en iyi şekilde iki ayrı gruba ayıran bir değişken tanımlayacaktır.
İkinci olarak, bu gruplar belirli bir büyüklüğe ulaşana kadar veya artık bu alt gruplarda iyileştirme yapamazsa, her alt grupta bir önceki adımdaki işlemi tekrarlayacaktır.

Örnek olarak aşağıdaki verilere sahibiz:

Yukarıdaki verilerde, bir bisikletin zamanına ve ivmesine sahipsiniz. Hızını zamana göre tahmin etmeliyiz. Bunu aşağıdakileri yaparak yapacağız:

1 kitaplık(rpart)

Ardından verileri yükleyin:

1 veri(bisiklet)

Şimdi bir dağılım grafiği oluşturacağız:

1 nokta(hızlanma~süre,veri=bisiklet)

Bir kez, bunu yaptık ve ağacı oluşturacağız:

1mct <- rpart(hızlanma ~ kez, veri=bisiklet)

Son adımımız grafiği çizmek:

1Arsa(mct)

Okuyun: Mükemmel karar ağacı nasıl oluşturulur?

Son düşünceler

Artık R'deki Karar ağacının mükemmel çalışan bir modeline sahibiz. Blogumuzda buna benzer daha fazla öğretici bulabilirsiniz.

Karar ağaçları, makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, IIIT-B & upGrad'ın çalışan profesyoneller için tasarlanmış ve 450+ saatlik zorlu eğitim, 30'dan fazla vaka çalışması ve ödev sunan Makine Öğrenimi ve Yapay Zeka alanında PG Diplomasına göz atın , IIIT-B Mezunları statüsü, 5'ten fazla pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.

Bir karar ağacı algoritmasındaki en önemli özellik nedir?

Karar ağacı algoritmaları, kararlılık ve risk analizi için değerli bir araçtır ve genellikle bir grafik veya kurallar listesi olarak ifade edilir. Karar ağacı algoritmalarının kullanımının basitliği, en önemli özelliklerinden biridir. Görsel oldukları için kolayca anlaşılır ve alakalıdırlar. Kullanıcılar karar ağacı algoritmalarının oluşturulmasına aşina olmasalar bile bunu başarıyla uygulayabilirler. Karar ağacı algoritmaları, en yaygın olarak, önceki deneyimlere dayalı olarak gelecekteki olayları tahmin etmek ve rasyonel karar vermeye yardımcı olmak için kullanılır. Karar ağacı algoritmalarının bir diğer önemli alanı, aşağıda daha fazla tartışıldığı gibi, karar ağaçlarının bir sınıflandırma ve modelleme aracı olarak kullanıldığı veri madenciliğidir.

Karar ağacı algoritması ne kadar önemlidir?

Bir karar ağacı algoritması, bir kararın akla gelebilecek tüm sonuçlarının analizini zorlamak ve sonuca giden her yolu izlemek gibi önemli bir avantaja sahiptir. Her daldaki sonuçların ayrıntılı bir çalışmasını oluşturur ve daha fazla araştırma gerektiren karar düğümlerini gösterir. Ayrıca, her zorluk, karar yolu ve sonuca, karar ağacı algoritmaları tarafından benzersiz bir değer atanır. Bu yöntem, önemli karar yollarını vurgular, belirsizliği azaltır, belirsizliği ortadan kaldırır ve alternatif hareket tarzlarının mali sonuçlarını netleştirir. Gerçek bilgiler mevcut olmadığında, kullanıcılar koşullar için olasılıkları kullanarak basit karşılaştırmalar için seçenekleri birbirleriyle perspektife koymak için karar ağacı algoritmalarını kullanabilir.

Karar ağacı algoritması hangi tekniğe dayanmaktadır?

Karar ağacı algoritması, sınıflandırma ve regresyon sorunları için kullanılabilen karar ağacı tekniğine dayanmaktadır. Ad, bir dizi özellik tabanlı bölmeden kaynaklanan tahminleri görüntülemek için akış şeması benzeri bir ağaç yapısı kullanmayı ima eder. Bir kök düğümle başlar ve bir yaprak kararıyla sona erer. Bir karar ağacı üç tür düğümden oluşur, yani, genellikle karar düğümlerini temsil eden Kareler, genellikle dairelerle gösterilen Şans düğümleri ve uç düğümleri simgeleyen Üçgenler.