Rastgele Orman vs Karar Ağacı: Rastgele Orman ve Karar Ağacı Arasındaki Fark
Yayınlanan: 2020-12-30Son gelişmeler, çoklu algoritmaların büyümesini sağlamıştır. Bu yeni ve cayır cayır yanan algoritmalar verileri ateşe verdi. Verileri işlemeye ve onlarla etkili bir şekilde karar vermeye yardımcı olurlar. Çünkü dünya bir internet çılgınlığıyla uğraşıyor. Hemen hemen her şey internette. Bu tür verileri işlemek için kararlar ve yorumlar yapmak için titiz algoritmalara ihtiyacımız var. Şimdi, geniş bir algoritma listesinin varlığında, en uygun olanı seçmek ağır bir iştir.
Karar verme algoritmaları çoğu kuruluş tarafından yaygın olarak kullanılmaktadır. Her iki saatte bir önemsiz ve büyük kararlar vermek zorundalar. Yüksek brüt alanlar elde etmek için hangi malzemenin seçileceğini analiz ederek, arka uçta bir karar veriliyor. Son python ve ML gelişmeleri, verileri işleme konusunda çıtayı zorladı. Bu nedenle, veriler büyük yığınlar halinde bulunur. Eşik, kuruluşa bağlıdır. Yaygın olarak kullanılan 2 ana karar algoritması vardır. Karar Ağacı ve Rastgele Orman - Kulağa tanıdık geliyor, değil mi?
Ağaçlar ve ormanlar!
Bunu kolay bir örnekle inceleyelim.
Bir paket Rs satın almanız gerektiğini varsayalım. 10 tatlı bisküvi. Şimdi birkaç bisküvi markasından birine karar vermelisin.
Bir karar ağacı algoritması seçersiniz. Şimdi, Rs'yi kontrol edecek. 10 paket, ki bu tatlı. Muhtemelen en çok satılan bisküvileri seçecektir. Rs için gitmeye karar vereceksiniz. 10 çikolatalı bisküvi. Sen mutlusun!

Ama arkadaşınız Rastgele orman algoritmasını kullandı. Şimdi birkaç karar aldı. Ayrıca, çoğunluk kararının seçilmesi. Çeşitli çilek, vanilya, yaban mersini ve portakal aromaları arasından seçim yapar. Belirli bir Rs olup olmadığını kontrol eder. 10 paket, orijinalinden 3 birim daha fazla hizmet etti. Vanilyalı çikolata içinde servis edildi. O vanilyalı çikolatalı bisküviyi aldı. En mutlusu o, sen ise kararından pişmanlık duyacaksın.
Kariyerinizi hızlandırmak için Dünyanın En İyi Üniversitelerinden Makine Öğrenimi Çevrimiçi Kursuna katılın - Yüksek Lisanslar, Yönetici Yüksek Lisans Programları ve Makine Öğrenimi ve Yapay Zekada İleri Düzey Sertifika Programı.
İçindekiler
Karar Ağacı ve Rastgele Orman arasındaki fark nedir?
1. Karar Ağacı
Kaynak
Karar Ağacı, makine öğreniminde kullanılan denetimli bir öğrenme algoritmasıdır. Hem sınıflandırma hem de regresyon algoritmalarında çalıştı. Adından da anlaşılacağı gibi, düğümleri olan bir ağaç gibidir. Dallar kriter sayısına bağlıdır. Bir eşik birimine ulaşana kadar verileri bu gibi dallara böler. Bir karar ağacında kök düğümler, alt düğümler ve yaprak düğümler bulunur.
Düğümler arasında geçiş yapmak için özyineleme kullanılır. Başka bir algoritmaya ihtiyacınız yok. Verileri doğru bir şekilde işler ve en iyi şekilde doğrusal bir modelde çalışır. Büyük verileri kolayca işler ve daha az zaman alır.
O nasıl çalışır?
1. Bölme
Veriler karar ağacına verildiğinde dallar altında çeşitli kategorilere ayrılır.
Mutlaka Okuyun: Naive Bayes Sınıflandırıcısı: Artıları ve Eksileri, Uygulamalar ve Açıklanan Türler
2. Budama
Budama ayrıca bu dalların parçalanmasıdır. Verileri daha iyi bir şekilde sübvanse etmek için bir sınıflandırma olarak çalışır. Tıpkı fazlalıkların budaması dediğimiz gibi, aynı şekilde çalışır. Yaprak düğümüne ulaşılır ve budama biter. Karar ağaçlarının çok önemli bir parçasıdır.
3. Ağaç seçimi
Şimdi, verilerinizle sorunsuz çalışabilecek en iyi ağacı seçmelisiniz.
İşte dikkate alınması gereken faktörler:
4. Entropi
Ağaçların homojenliğini kontrol etmek için entropinin çıkarılması gerekir. Entropi sıfırsa, homojendir; başka değil.
5. Bilgi kazanımı
Entropi azaldığında bilgi elde edilir. Bu bilgi dalları daha da bölmeye yardımcı olur.
- Entropiyi hesaplamanız gerekir.
- Verileri farklı kriterlere göre ayırın
- En iyi bilgiyi seçin.
Ağaç derinliği önemli bir husustur. Derinlik, bir sonuca varmadan önce verilmesi gereken kararların sayısı hakkında bizi bilgilendirir. Sığ derinlik ağaçları, karar ağacı algoritmalarıyla daha iyi performans gösterir.

Karar Ağacının Avantaj ve Dezavantajları
Avantajlar
- Kolay
- Şeffaf süreç
- Hem sayısal hem de kategorik verileri işleyin
- Veriler ne kadar büyük olursa, sonuç o kadar iyi olur
- Hız
Dezavantajları
- fazla sığabilir
- Budama işlemi büyük
- Optimizasyon garantisi yok
- Karmaşık hesaplamalar
- yüksek sapma
Ödeme: Açıklanan Makine Öğrenimi Modelleri
2. Rastgele Orman
Kaynak
Denetimli öğrenme için de kullanılır ancak çok güçlüdür. Çok yaygın olarak kullanılmaktadır. Temel fark, tekil bir karara dayanmamasıdır. Birkaç karara dayalı rastgele kararları bir araya getirir ve çoğunluğa göre nihai kararı verir.
En iyi tahmini aramaz. Bunun yerine, birden çok rastgele tahminde bulunur. Böylece daha fazla çeşitlilik eklenir ve tahmin çok daha pürüzsüz hale gelir.
Rastgele ormanı birden çok karar ağacının bir koleksiyonu olarak çıkarabilirsiniz!
Torbalama, kararlar paralel olarak çalışırken rastgele ormanlar oluşturma sürecidir.
1. Torbalama
- Biraz eğitim veri seti alın
- Bir karar ağacı yapın
- Belirli bir süre için işlemi tekrarlayın
- Şimdi büyük oyu alın. Kazanan, alma kararınızdır.
2. Önyükleme
Önyükleme, eğitim verilerinden rastgele örnekler seçmektir. Bu rastgele bir prosedürdür.
Adım adım

- Rastgele seçim koşulları
- Kök düğümü hesaplayın
- Bölmek
- Tekrar et
- bir orman alırsın
Okuyun: Naive Bayes Açıklaması
Rastgele Ormanın Avantajları ve Dezavantajları
Avantajlar
- Güçlü ve son derece hassas
- normalleştirmeye gerek yok
- Aynı anda birkaç özelliği işleyebilir
- Ağaçları paralel yollarla çalıştırın
Dezavantajları
- Bazen belirli özelliklere önyargılıdırlar
- Yavaş
- Doğrusal yöntemler için kullanılamaz
- Yüksek boyutlu veriler için daha kötü
Çözüm
Karar ağaçları, rastgele ormana kıyasla çok kolaydır. Bir karar ağacı bazı kararları birleştirir, oysa rastgele bir orman birkaç karar ağacını birleştirir. Bu nedenle, uzun ama yavaş bir süreçtir.
Oysa bir karar ağacı hızlıdır ve büyük veri kümelerinde, özellikle doğrusal olanlarda kolayca çalışır. Rastgele orman modelinin sıkı bir eğitime ihtiyacı var. Bir proje ortaya koymaya çalışırken birden fazla modele ihtiyacınız olabilir. Böylece, çok sayıda rastgele orman, daha fazla zaman.
Gereksinimlerinize bağlıdır. Bir model üzerinde çalışmak için daha az zamanınız varsa, bir karar ağacı seçmek zorundasınız. Bununla birlikte, istikrar ve güvenilir tahminler rastgele ormanların sepetindedir.
Tutkunuz varsa ve yapay zeka hakkında daha fazla bilgi edinmek istiyorsanız, IIIT-B & upGrad'ın 400+ saatlik öğrenme, pratik oturumlar, iş yardımı ve çok daha fazlasını sunan Makine Öğrenimi ve Derin Öğrenmede PG Diplomasını alabilirsiniz.
Rastgele orman normal bir karar ağacından nasıl farklıdır?
Makine öğreniminde Karar Ağacı, denetimli bir öğrenme tekniğidir. Hem sınıflandırma hem de regresyon teknikleri ile çalışabilir. Adından da anlaşılacağı gibi düğümleri olan bir ağaca benzer. Kriterlerin miktarı şubeleri belirler. Bir eşik birimine ulaşana kadar verileri bu dallara böler. Bir karar ağacında kök düğümler, alt düğümler ve yaprak düğümler vardır. Rastgele orman, çok fazla güce sahip olmasına rağmen denetimli öğrenme için de kullanılır. Oldukça popüler. Temel fark, tek bir karara dayanmamasıdır. Birçok karara dayalı rastgele kararları bir araya getirir ve daha sonra çoğunluğa bağlı olarak nihai bir karar oluşturur.
Tek bir karar ağacına karşı rastgele bir orman kullanmanın başlıca avantajları nelerdir?
İdeal bir dünyada, hem önyargıyla ilgili hem de varyansla ilgili hataları azaltmak istiyoruz. Bu sorun, rastgele ormanlar tarafından iyi bir şekilde ele alınmaktadır. Rastgele bir orman, bulgularının tek bir nihai sonuç halinde bir araya getirildiği bir dizi karar ağacından başka bir şey değildir. Önyargı nedeniyle hatayı büyük ölçüde artırmadan fazla takmayı azaltma yetenekleri nedeniyle çok güçlüler. Rastgele ormanlar ise tek bir karar ağacından çok daha dayanıklı olan güçlü bir modelleme aracıdır. Çok sayıda karar ağacını birleştirerek fazla uydurmayı ve önyargıyla ilgili yanlışlığı azaltırlar ve dolayısıyla kullanılabilir sonuçlar üretirler.
Karar ağaçlarının sınırlaması nedir?
Karar ağaçlarının dezavantajlarından biri, diğer seçim tahmin edicileriyle karşılaştırıldığında çok kararsız olmalarıdır. Verilerdeki küçük bir değişiklik, karar ağacının yapısında önemli bir değişikliğe neden olabilir ve bu da tüketicilerin tipik bir olayda beklediğinden farklı bir sonuçla sonuçlanabilir. Ayrıca, asıl amaç sürekli bir değişkenin sonucunu tahmin etmek olduğunda, karar ağaçları tahminlerde daha az yardımcı olur.