Rastgele Orman vs Karar Ağacı: Rastgele Orman ve Karar Ağacı Arasındaki Fark

Yayınlanan: 2020-12-30

Son gelişmeler, çoklu algoritmaların büyümesini sağlamıştır. Bu yeni ve cayır cayır yanan algoritmalar verileri ateşe verdi. Verileri işlemeye ve onlarla etkili bir şekilde karar vermeye yardımcı olurlar. Çünkü dünya bir internet çılgınlığıyla uğraşıyor. Hemen hemen her şey internette. Bu tür verileri işlemek için kararlar ve yorumlar yapmak için titiz algoritmalara ihtiyacımız var. Şimdi, geniş bir algoritma listesinin varlığında, en uygun olanı seçmek ağır bir iştir.

Karar verme algoritmaları çoğu kuruluş tarafından yaygın olarak kullanılmaktadır. Her iki saatte bir önemsiz ve büyük kararlar vermek zorundalar. Yüksek brüt alanlar elde etmek için hangi malzemenin seçileceğini analiz ederek, arka uçta bir karar veriliyor. Son python ve ML gelişmeleri, verileri işleme konusunda çıtayı zorladı. Bu nedenle, veriler büyük yığınlar halinde bulunur. Eşik, kuruluşa bağlıdır. Yaygın olarak kullanılan 2 ana karar algoritması vardır. Karar Ağacı ve Rastgele Orman - Kulağa tanıdık geliyor, değil mi?

Ağaçlar ve ormanlar!

Bunu kolay bir örnekle inceleyelim.

Bir paket Rs satın almanız gerektiğini varsayalım. 10 tatlı bisküvi. Şimdi birkaç bisküvi markasından birine karar vermelisin.

Bir karar ağacı algoritması seçersiniz. Şimdi, Rs'yi kontrol edecek. 10 paket, ki bu tatlı. Muhtemelen en çok satılan bisküvileri seçecektir. Rs için gitmeye karar vereceksiniz. 10 çikolatalı bisküvi. Sen mutlusun!

Ama arkadaşınız Rastgele orman algoritmasını kullandı. Şimdi birkaç karar aldı. Ayrıca, çoğunluk kararının seçilmesi. Çeşitli çilek, vanilya, yaban mersini ve portakal aromaları arasından seçim yapar. Belirli bir Rs olup olmadığını kontrol eder. 10 paket, orijinalinden 3 birim daha fazla hizmet etti. Vanilyalı çikolata içinde servis edildi. O vanilyalı çikolatalı bisküviyi aldı. En mutlusu o, sen ise kararından pişmanlık duyacaksın.

Kariyerinizi hızlandırmak için Dünyanın En İyi Üniversitelerinden Makine Öğrenimi Çevrimiçi Kursuna katılın - Yüksek Lisanslar, Yönetici Yüksek Lisans Programları ve Makine Öğrenimi ve Yapay Zekada İleri Düzey Sertifika Programı.

İçindekiler

Karar Ağacı ve Rastgele Orman arasındaki fark nedir?
- 1. Karar Ağacı
  - O nasıl çalışır?
- Karar Ağacının Avantaj ve Dezavantajları
  - Avantajlar
  - Dezavantajları
- 2. Rastgele Orman
  - 1. Torbalama
  - 2. Önyükleme
  - Rastgele Ormanın Avantajları ve Dezavantajları
    - Avantajlar
    - Dezavantajları
Çözüm
Rastgele orman normal bir karar ağacından nasıl farklıdır?
Tek bir karar ağacına karşı rastgele bir orman kullanmanın başlıca avantajları nelerdir?
Karar ağaçlarının sınırlaması nedir?

Karar Ağacı ve Rastgele Orman arasındaki fark nedir?

1. Karar Ağacı

Kaynak

Karar Ağacı, makine öğreniminde kullanılan denetimli bir öğrenme algoritmasıdır. Hem sınıflandırma hem de regresyon algoritmalarında çalıştı. Adından da anlaşılacağı gibi, düğümleri olan bir ağaç gibidir. Dallar kriter sayısına bağlıdır. Bir eşik birimine ulaşana kadar verileri bu gibi dallara böler. Bir karar ağacında kök düğümler, alt düğümler ve yaprak düğümler bulunur.

Düğümler arasında geçiş yapmak için özyineleme kullanılır. Başka bir algoritmaya ihtiyacınız yok. Verileri doğru bir şekilde işler ve en iyi şekilde doğrusal bir modelde çalışır. Büyük verileri kolayca işler ve daha az zaman alır.

O nasıl çalışır?

1. Bölme

Veriler karar ağacına verildiğinde dallar altında çeşitli kategorilere ayrılır.

Mutlaka Okuyun: Naive Bayes Sınıflandırıcısı: Artıları ve Eksileri, Uygulamalar ve Açıklanan Türler

2. Budama

Budama ayrıca bu dalların parçalanmasıdır. Verileri daha iyi bir şekilde sübvanse etmek için bir sınıflandırma olarak çalışır. Tıpkı fazlalıkların budaması dediğimiz gibi, aynı şekilde çalışır. Yaprak düğümüne ulaşılır ve budama biter. Karar ağaçlarının çok önemli bir parçasıdır.

3. Ağaç seçimi

Şimdi, verilerinizle sorunsuz çalışabilecek en iyi ağacı seçmelisiniz.

İşte dikkate alınması gereken faktörler:

4. Entropi

Ağaçların homojenliğini kontrol etmek için entropinin çıkarılması gerekir. Entropi sıfırsa, homojendir; başka değil.

5. Bilgi kazanımı

Entropi azaldığında bilgi elde edilir. Bu bilgi dalları daha da bölmeye yardımcı olur.

Entropiyi hesaplamanız gerekir.
Verileri farklı kriterlere göre ayırın
En iyi bilgiyi seçin.

Ağaç derinliği önemli bir husustur. Derinlik, bir sonuca varmadan önce verilmesi gereken kararların sayısı hakkında bizi bilgilendirir. Sığ derinlik ağaçları, karar ağacı algoritmalarıyla daha iyi performans gösterir.

Karar Ağacının Avantaj ve Dezavantajları

Avantajlar

Kolay
Şeffaf süreç
Hem sayısal hem de kategorik verileri işleyin
Veriler ne kadar büyük olursa, sonuç o kadar iyi olur
Hız

Dezavantajları

fazla sığabilir
Budama işlemi büyük
Optimizasyon garantisi yok
Karmaşık hesaplamalar
yüksek sapma

Ödeme: Açıklanan Makine Öğrenimi Modelleri

2. Rastgele Orman

Kaynak

Denetimli öğrenme için de kullanılır ancak çok güçlüdür. Çok yaygın olarak kullanılmaktadır. Temel fark, tekil bir karara dayanmamasıdır. Birkaç karara dayalı rastgele kararları bir araya getirir ve çoğunluğa göre nihai kararı verir.

En iyi tahmini aramaz. Bunun yerine, birden çok rastgele tahminde bulunur. Böylece daha fazla çeşitlilik eklenir ve tahmin çok daha pürüzsüz hale gelir.

Rastgele ormanı birden çok karar ağacının bir koleksiyonu olarak çıkarabilirsiniz!

Torbalama, kararlar paralel olarak çalışırken rastgele ormanlar oluşturma sürecidir.

1. Torbalama

Biraz eğitim veri seti alın
Bir karar ağacı yapın
Belirli bir süre için işlemi tekrarlayın
Şimdi büyük oyu alın. Kazanan, alma kararınızdır.

2. Önyükleme

Önyükleme, eğitim verilerinden rastgele örnekler seçmektir. Bu rastgele bir prosedürdür.

Adım adım

Rastgele seçim koşulları

Kök düğümü hesaplayın

Bölmek

Tekrar et

bir orman alırsın

Okuyun: Naive Bayes Açıklaması

Rastgele Ormanın Avantajları ve Dezavantajları

Avantajlar

Güçlü ve son derece hassas
normalleştirmeye gerek yok
Aynı anda birkaç özelliği işleyebilir
Ağaçları paralel yollarla çalıştırın

Dezavantajları

Bazen belirli özelliklere önyargılıdırlar
Yavaş
Doğrusal yöntemler için kullanılamaz
Yüksek boyutlu veriler için daha kötü

Çözüm

Karar ağaçları, rastgele ormana kıyasla çok kolaydır. Bir karar ağacı bazı kararları birleştirir, oysa rastgele bir orman birkaç karar ağacını birleştirir. Bu nedenle, uzun ama yavaş bir süreçtir.

Oysa bir karar ağacı hızlıdır ve büyük veri kümelerinde, özellikle doğrusal olanlarda kolayca çalışır. Rastgele orman modelinin sıkı bir eğitime ihtiyacı var. Bir proje ortaya koymaya çalışırken birden fazla modele ihtiyacınız olabilir. Böylece, çok sayıda rastgele orman, daha fazla zaman.

Gereksinimlerinize bağlıdır. Bir model üzerinde çalışmak için daha az zamanınız varsa, bir karar ağacı seçmek zorundasınız. Bununla birlikte, istikrar ve güvenilir tahminler rastgele ormanların sepetindedir.

Tutkunuz varsa ve yapay zeka hakkında daha fazla bilgi edinmek istiyorsanız, IIIT-B & upGrad'ın 400+ saatlik öğrenme, pratik oturumlar, iş yardımı ve çok daha fazlasını sunan Makine Öğrenimi ve Derin Öğrenmede PG Diplomasını alabilirsiniz.

Rastgele orman normal bir karar ağacından nasıl farklıdır?

Makine öğreniminde Karar Ağacı, denetimli bir öğrenme tekniğidir. Hem sınıflandırma hem de regresyon teknikleri ile çalışabilir. Adından da anlaşılacağı gibi düğümleri olan bir ağaca benzer. Kriterlerin miktarı şubeleri belirler. Bir eşik birimine ulaşana kadar verileri bu dallara böler. Bir karar ağacında kök düğümler, alt düğümler ve yaprak düğümler vardır. Rastgele orman, çok fazla güce sahip olmasına rağmen denetimli öğrenme için de kullanılır. Oldukça popüler. Temel fark, tek bir karara dayanmamasıdır. Birçok karara dayalı rastgele kararları bir araya getirir ve daha sonra çoğunluğa bağlı olarak nihai bir karar oluşturur.

Tek bir karar ağacına karşı rastgele bir orman kullanmanın başlıca avantajları nelerdir?

İdeal bir dünyada, hem önyargıyla ilgili hem de varyansla ilgili hataları azaltmak istiyoruz. Bu sorun, rastgele ormanlar tarafından iyi bir şekilde ele alınmaktadır. Rastgele bir orman, bulgularının tek bir nihai sonuç halinde bir araya getirildiği bir dizi karar ağacından başka bir şey değildir. Önyargı nedeniyle hatayı büyük ölçüde artırmadan fazla takmayı azaltma yetenekleri nedeniyle çok güçlüler. Rastgele ormanlar ise tek bir karar ağacından çok daha dayanıklı olan güçlü bir modelleme aracıdır. Çok sayıda karar ağacını birleştirerek fazla uydurmayı ve önyargıyla ilgili yanlışlığı azaltırlar ve dolayısıyla kullanılabilir sonuçlar üretirler.

Karar ağaçlarının sınırlaması nedir?

Karar ağaçlarının dezavantajlarından biri, diğer seçim tahmin edicileriyle karşılaştırıldığında çok kararsız olmalarıdır. Verilerdeki küçük bir değişiklik, karar ağacının yapısında önemli bir değişikliğe neden olabilir ve bu da tüketicilerin tipik bir olayda beklediğinden farklı bir sonuçla sonuçlanabilir. Ayrıca, asıl amaç sürekli bir değişkenin sonucunu tahmin etmek olduğunda, karar ağaçları tahminlerde daha az yardımcı olur.