Karar Ağacı Mülakat Soruları ve Cevapları [Yeni Başlayanlar ve Deneyimliler İçin]

Yayınlanan: 2020-09-22

Makine öğrenimi dünyasında, karar ağaçları en saygın olmasa da bunlardan biridir. Karar ağaçları da güçlüdür. Karar ağaçları, algoritmaya sağlanan örneklerin hem sürekli değerlerini (regresyon) tahmin etmek hem de sınıfları tahmin etmek (sınıflandırma veya sınıflandırma yapmak) için kullanılır.

Karar ağaçları, yapısında bir akış şemasına benzer. Herhangi bir karar ağacının düğümü, öznitelik üzerinde yapılan bir testi temsil eder. Karar ağacının her bir dalı, her bir düğümde yapılan incelemenin sonuçlarını temsil eder. Her yaprağın düğümü (terminal düğümleri olarak da bilinir) sınıfın etiketini tutar.

Bu ağacın yapısıyla ilgiliydi; ancak, karar ağaçlarının popülaritesindeki artış, onların yaratılma şekillerinden kaynaklanmıyor. Ağacın şeffaflığı, güçlü ve kullanışlı algoritmaların hakim olduğu dünyada kendi başına ayakta durmasını sağlar. Aslında küçük bir karar ağacı için her şeyi elle yapabilir ve karar ağacının nasıl oluşacağını tahmin edebilirsiniz. Boyut olarak daha büyük ağaçlar için bu egzersiz oldukça sıkıcı hale gelir.

Ancak bu, ağacın her düğümde ne yaptığını anlayamayacağınız anlamına gelmez. Perde arkasında veya kaputun altında neler olduğunu kavrama yeteneği, karar ağaçlarını diğer makine öğrenimi algoritmalarından gerçekten farklı kılar.

Karar ağaçlarının ne kadar hayati olduğunu gördüğümüz gibi, karar ağaçlarının herhangi bir makine öğrenimi uzmanı veya veri bilimcisi için de kritik olması doğaldır. Bu kavramı anlamanıza yardımcı olmak ve aynı zamanda mülakat yeteneğinize ekstra canlılık kazandırmak için, kapsamlı bir karar ağacı mülakat soruları ve karar ağacı mülakat soruları ve cevapları listesi hazırladık. Bu sorular, herhangi bir röportajda başarılı olmanıza yardımcı olmalıdır. Bu sorulardan en iyi şekilde yararlanmak için çözümleri okumadan önce bu soruların her birini çözmeye çalışın.

İçindekiler

Karar Ağacı Mülakat Soruları ve Cevapları

S1. Aşağıda listelenen iki ifade göreceksiniz. Her ikisini de dikkatlice okumanız ve ardından iki ifadenin seçeneklerinden birini seçmeniz gerekecektir. Bağlamsal soru şudur: Ağaçları torbalamak için doğru olan ifadeleri seçin.

Tek tek ağaçlar, bir torbalama ağacı için birbirine hiç bağımlı değildir.
Modelin genel performansını iyileştirmek için, zayıf öğrenenlerden toplam alınır. Bu yöntem, ağaçların torbalanması olarak bilinir.
Yalnızca bir numaralı ifade DOĞRU'dur.
Yalnızca iki numaralı ifade DOĞRU'dur.
Hem bir hem de iki ifadeleri DOĞRU'dur.
Yukarıda belirtilen seçeneklerden hiçbiri.

Ans. Bu sorunun doğru cevabı C'dir çünkü bir torbalama ağacı için bu ifadelerin ikisi de doğrudur. Torbalama ağaçlarında veya önyükleme toplamada, bu algoritmayı uygulamanın temel amacı, karar ağacında mevcut olan varyans miktarını azaltmaktır. Torbalama ağacı oluşturma mekanizması, değiştirme ile, verileri eğitmek için mevcut örnekten bir dizi alt kümenin alınmasıdır.

Şimdi, bu daha küçük veri alt kümelerinin her biri, ayrı bir karar ağacını eğitmek için kullanılıyor. Her ağaca verilen bilgi benzersiz olduğu için herhangi bir ağacın diğerine etki etme olasılığı çok düşük oluyor. Tüm bu ağaçların verdiği nihai sonuç toplanır ve daha sonra çıktıyı sağlamak için işlenir. Böylece, ikinci ifadenin de doğru olduğu ortaya çıkıyor.

S2. Aşağıda listelenen iki ifade göreceksiniz. Her ikisini de dikkatlice okumanız ve ardından iki ifadenin seçeneklerinden birini seçmeniz gerekecektir. Bağlamsal soru şudur: Ağaçları güçlendirme konusunda doğru olan ifadeleri seçin.

Bir güçlendirme ağacındaki zayıf öğrenenler birbirinden bağımsızdır.
Zayıf öğrencilerin performansının tümü, artırılmış ağacın genel performansını iyileştirmek için toplanır ve toplanır.
Yalnızca bir numaralı ifade DOĞRU'dur.
Yalnızca iki numaralı ifade DOĞRU'dur.
Hem bir hem de iki ifadeleri DOĞRU'dur.
Yukarıda belirtilen seçeneklerden hiçbiri.

Ans. Ağaçların güçlendirilmesinin nasıl yapıldığını anlasaydınız, anlayacaksınız ve doğru ifadeyi yanlış olan ifadeden ayırt edebileceksiniz. Böylece, birçok zayıf öğrenci seri olarak bağlandığında güçlendirilmiş bir ağaç oluşturulur. Bu dizide bulunan her ağacın tek bir amacı vardır: selefinin yaptığı hatayı azaltmak.

Ağaçlar bu şekilde bağlanırsa, tüm ağaçlar birbirinden bağımsız olamaz, bu nedenle ilk ifade yanlış olur. İkinci ifadeye gelindiğinde, bunun temel nedeni, yükseltilmiş bir ağaçta, modelin genel performansını iyileştirmek için uygulanan yöntemin bu olmasıdır. Doğru seçenek B olacaktır, yani sadece iki numaralı ifade DOĞRU ve bir numaralı ifade YANLIŞ'tır.

S3. Aşağıda listelenen dört ifade göreceksiniz. Hepsini dikkatlice okumanız ve ardından dört ifadeyi takip eden seçeneklerden birini seçmeniz gerekecektir. Bağlamsal soru şudur: Radom ormanları ve Gradyan artırma topluluğu yöntemi hakkında doğru olan ifadeleri seçin.

Sınıflandırma yapmak için hem Rastgele orman hem de Gradyan artırma topluluğu yöntemleri kullanılabilir.
Rastgele Ormanlar, sınıflandırma görevlerini gerçekleştirmek için kullanılabilirken, gradyan artırma yöntemi yalnızca regresyon gerçekleştirebilir.
Gradyan artırma, sınıflandırma görevlerini gerçekleştirmek için kullanılabilirken Rastgele Orman yöntemi yalnızca regresyon gerçekleştirebilir.
Regresyon gerçekleştirmek için hem Rastgele orman hem de Gradyan artırma topluluğu yöntemleri kullanılabilir.
Yalnızca bir numaralı ifade DOĞRU'dur.
Yalnızca iki numaralı ifade DOĞRU'dur.
Hem bir hem de iki ifadeleri DOĞRU'dur.
Yalnızca üç numaralı ifade DOĞRU
Yalnızca dört numaralı ifade DOĞRU
Yalnızca bir ve dört numaralı ifade DOĞRU

Ans. Bu sorunun cevabı açıktır. Bu topluluk yöntemlerinin her ikisi de aslında hem sınıflandırma hem de regresyon görevlerini gerçekleştirme konusunda oldukça yeteneklidir. Yani bu sorunun cevabı F olacaktır çünkü sadece bir ve dört numaralı ifadeler DOĞRU'dur.

S4 Aşağıda listelenen dört ifade göreceksiniz. Hepsini dikkatlice okumanız ve ardından dört ifadeyi takip eden seçeneklerden birini seçmeniz gerekecektir. Bağlamsal soru, rastgele bir ağaç ormanı düşünün. Peki rastgele ormandaki ağaçların her biri veya herhangi biri için doğru olan ne olacak?

Rastgele ormanı oluşturan her ağaç, tüm özelliklerin alt kümesine dayanır.
Rastgele bir ormandaki her birinin tüm özellikleri üzerine inşa edilmiştir.
Rastgele bir ormandaki ağaçların her biri, mevcut tüm gözlemlerin bir alt kümesi üzerine kuruludur.
Rastgele bir ormandaki ağaçların her biri, tam gözlem seti üzerine kuruludur.
Yalnızca bir numaralı ifade DOĞRU'dur.
Yalnızca iki numaralı ifade DOĞRU'dur.
Hem bir hem de iki ifadeleri DOĞRU'dur.
Yalnızca üç numaralı ifade DOĞRU
Yalnızca dört numaralı ifade DOĞRU
Bir ve dört numaralı ifadelerin ikisi de DOĞRU
Hem bir hem de üç numaralı ifadeler DOĞRU
Hem iki hem de üç numaralı ifadeler DOĞRU
Hem iki hem de dört numaralı ifadeler DOĞRU

Ans. Rastgele ormanların oluşturulması, torbalama kavramına dayanmaktadır. Rastgele bir orman oluşturmak için hem gözlemlerden hem de özelliklerden küçük bir alt küme alınır. Alt kümeler çıkarıldıktan sonra elde edilen değerler daha sonra tekil karar ağaçlarına beslenir. Daha sonra, bu tür karar ağaçlarından elde edilen tüm değerler, nihai kararı vermek için toplanır. Bu, doğru olan tek ifadelerin bir ve üç olacağı anlamına gelir. O halde doğru seçenek G olacaktır.

S5 Aşağıda listelenen dört ifade göreceksiniz. Hepsini dikkatlice okumanız ve ardından dört ifadeyi takip eden seçeneklerden birini seçmeniz gerekecektir. Bağlamsal soru, gradyan artırma algoritmasının "max_depth" olarak bilinen hiperparametresi hakkında doğru ifadeleri seçmektir.

Doğrulama kümesinin doğruluğu benzerse, bu hiper parametrenin daha düşük bir değerini seçmek daha iyidir.
Doğrulama kümesinin doğruluğu benzerse, bu hiperparametrenin daha yüksek bir değerini seçmek daha iyidir.
Bu hiperparametrenin değerini artıracaksak, bu modelin veriye gerçekten fazla uyma olasılığı artar.
Bu hiperparametrenin değerini artıracaksak, bu modelin aslında verilere uymama olasılığı artar.
Yalnızca bir numaralı ifade DOĞRU'dur.
Yalnızca iki numaralı ifade DOĞRU'dur.
Hem bir hem de iki ifadeleri DOĞRU'dur.
Yalnızca üç numaralı ifade DOĞRU
Yalnızca dört numaralı ifade DOĞRU
Bir ve dört numaralı ifadelerin ikisi de DOĞRU
Hem bir hem de üç numaralı ifadeler DOĞRU
Hem iki hem de üç numaralı ifadeler DOĞRU
Hem iki hem de dört numaralı ifadeler DOĞRU

Ans. Maksimum_derinlik hiperparametresi, gradyan artırma, onun önünde sunulan verileri modelleyene kadar derinliği kontrol eder. Bu hiperparametrenin değerini artırmaya devam ederseniz, model aşırı sığmaya mahkumdur. Yani, üç numaralı ifade doğrudur. Doğrulama verilerinde aynı puanlara sahipsek, genellikle daha düşük derinliğe sahip modeli tercih ederiz. Yani, bir ve üç numaralı ifadeler doğrudur ve dolayısıyla bu karar ağacı görüşme sorularının cevabı g'dir.

S6. Aşağıda listelenen dört ifade göreceksiniz. Hepsini dikkatlice okumanız ve ardından dört ifadeyi takip eden seçeneklerden birini seçmeniz gerekecektir. Bağlamsal soru, aşağıdaki yöntemlerden hangisinin ayarlanabilir hiperparametrelerinden biri olarak bir öğrenme oranına sahip olmadığıdır.

Ekstra Ağaçlar.
AdaBoost
Rastgele Orman
Gradyan artırma.
Yalnızca bir numaralı ifade DOĞRU'dur.
Yalnızca iki numaralı ifade DOĞRU'dur.
Hem bir hem de iki ifadeleri DOĞRU'dur.
Yalnızca üç numaralı ifade DOĞRU
Yalnızca dört numaralı ifade DOĞRU
Bir ve dört numaralı ifadelerin ikisi de DOĞRU
Hem bir hem de üç numaralı ifadeler DOĞRU
Hem iki hem de üç numaralı ifadeler DOĞRU
Hem iki hem de dört numaralı ifadeler DOĞRU

Ans. Yalnızca Ekstra Ağaçlar ve Rastgele orman, ayarlanabilir hiperparametrelerinden biri olarak bir öğrenme oranına sahip değildir. Yani, bir ve üç numaralı ifade DOĞRU olduğu için cevap g olacaktır.

S7. Doğru olan seçeneği seçin.

Sadece rastgele orman algoritmasında, gerçek değerler ayrık hale getirilerek işlenebilir.
Yalnızca gradyan artırma algoritmasında, gerçek değerler ayrık hale getirilerek işlenebilir.
Hem rastgele ormanda hem de gradyan artırmada, gerçek değerler ayrık hale getirilerek işlenebilir.
Yukarıda belirtilen seçeneklerden hiçbiri.

Ans. Algoritmaların her ikisi de yetenekli olanlardır. Her ikisi de içinde gerçek değerleri olan özellikleri kolaylıkla halledebilir. Yani bu karar ağacı mülakat soru ve cevaplarının cevabı C'dir.

S8. Aşağıdaki listeden bir seçenek seçin. Soru, topluluk öğrenme algoritması olmayan algoritmayı seçmektir.

Gradyan artırma
AdaBoost
Ekstra Ağaçlar
Rastgele Orman
Karar ağaçları

Ans. Bu soru basit. Bu algoritmalardan sadece biri topluluk öğrenme algoritması değildir. Akılda tutulması gereken bir temel kural, herhangi bir topluluk öğrenme yönteminin birden fazla karar ağacının kullanımını içermesidir. E seçeneğinde yalnızca tekil karar ağacı olduğundan, bu bir topluluk öğrenme algoritması değildir. Dolayısıyla bu sorunun cevabı E (karar ağaçları) olacaktır.

S9. Aşağıda listelenen iki ifade göreceksiniz. Her ikisini de dikkatlice okumanız ve ardından iki ifadenin seçeneklerinden birini seçmeniz gerekecektir. Bağlamsal soru, topluluk öğrenimi paradigmasında aşağıdakilerden hangisinin doğru olacağıdır.

Topluluktaki ağaç sayısı mümkün olduğunca yüksek olmalıdır.
Random Forest algoritmasını uyguladıktan sonra bile neler olduğunu yorumlayabileceksiniz.
Yalnızca bir numaralı ifade DOĞRU'dur.
Yalnızca iki numaralı ifade DOĞRU'dur.
Hem bir hem de iki ifadeleri DOĞRU'dur.
Yukarıda belirtilen seçeneklerden hiçbiri.

Ans. Herhangi bir topluluk öğrenme yöntemi, çok sayıda karar ağacını (kendi başına çok zayıf bir öğrenicidir) bir araya getirmeye dayandığından, topluluk yönteminizi yapmak için daha fazla sayıda ağaca sahip olmak her zaman faydalı olacaktır. Ancak rastgele ormanın algoritması bir kara kutu gibidir. Modelin içinde neler olduğunu bilemezsiniz. Bu nedenle, rastgele orman algoritmasını uyguladıktan sonra tüm yorumlanabilirliği kaybetmeye mahkumsunuz. Dolayısıyla, bu sorunun doğru cevabı A olacaktır çünkü yalnızca doğru olan ifade bir numaralı ifadedir.

S10. Yalnızca DOĞRU veya YANLIŞ olarak yanıtlayın. Torbalama algoritması, yüksek varyansa ve düşük sapmaya sahip modeller için en iyi sonucu verir?

Ans. Doğru. Torbalama gerçekten de yüksek varyans ve düşük sapma modeli için kullanılmak için en uygunudur.

S11. . Aşağıda listelenen iki ifade göreceksiniz. Her ikisini de dikkatlice okumanız ve ardından iki ifadenin seçeneklerinden birini seçmeniz gerekecektir. Bağlamsal soru, Gradient güçlendirme ağaçları için doğru fikirleri seçmektir.

Yükseltmenin her aşamasında, algoritma, mevcut tüm model sorunlarının telafi edilmesini sağlamak için başka bir ağaç sunar.
Kayıp fonksiyonunu en aza indirmek için bir gradyan iniş algoritması uygulayabiliriz.
Yalnızca bir numaralı ifade DOĞRU'dur.
Yalnızca iki numaralı ifade DOĞRU'dur.
Hem bir hem de iki ifadeleri DOĞRU'dur.
Yukarıda belirtilen seçeneklerden hiçbiri.

Ans. Bu sorunun cevabı C'dir, yani her iki seçenek de DOĞRU'dur. İlk ifade için, artırma algoritması böyle çalışır. Modele eklenen yeni ağaçlar, sadece mevcut algoritmanın performansını artırmak içindir. Evet, gradyan iniş algoritması, kayıp fonksiyonunu azaltmak için uygulanan fonksiyondur.

Q12. Gradyan artırma algoritmasında, öğrenme oranı ile ilgili aşağıdaki ifadelerden hangisi doğrudur?

Belirlediğiniz öğrenme oranı mümkün olduğunca yüksek olmalıdır.
Belirlediğiniz öğrenme oranı mümkün olduğu kadar yüksek değil, yapabildiğiniz kadar düşük olmalıdır.
Öğrenme oranı düşük olmalı ama çok düşük olmamalıdır.
Ayarladığınız öğrenme oranı yüksek olmalı, ancak çok yüksek olmamalıdır.

Ans. Öğrenme oranı düşük olmalı, ancak çok düşük olmamalıdır, bu nedenle bu karar ağacı görüşme sorularının ve cevaplarının cevabı C seçeneği olacaktır.

Kontrol edin: Makine Öğrenimi Mülakat Soruları

Sıradaki ne?

Karar ağacı, Makine Öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, IIIT-B & upGrad'ın çalışan profesyoneller için tasarlanmış ve 450+ saatlik zorlu eğitim, 30'dan fazla vaka çalışması ve Makine Öğrenimi ve Yapay Zeka alanında PG Diplomasına göz atın. atamalar, IIIT-B Mezun statüsü, 5+ pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.

Karar ağacı nasıl geliştirilebilir?

Karar ağacı, koşullu özerk veya karar noktalarının düğümler ve çeşitli olası sonuçların yapraklar olarak temsil edildiği basit bir görsel yardım oluşturmak için bir araçtır. Basit bir deyişle, bir karar ağacı, karar verme sürecinin bir modelidir. Durdurma kriterlerinin her zaman açık olmasını sağlayarak karar ağacını iyileştirebilirsiniz. Durdurma kriterleri açık olmadığında, daha fazla araştırmanın gerekli olup olmadığını merak eder ve ayrıca durup durmama konusunda şüpheler bırakır. Karar ağacı da takip etmesi kolay olacak ve okuyucunun kafasını karıştırmayacak şekilde oluşturulmalıdır.

Karar ağacı doğruluğu neden bu kadar düşük?

Karar ağacı doğruluğu beklediğimizden daha düşük. Bu, aşağıdaki nedenlerden dolayı olabilir: Kötü veri - Makine öğrenmesi algoritmaları için doğru verilerin kullanılması çok önemlidir. Kötü veriler yanlış sonuçlara yol açabilir. Rastgelelik - Bazen sistem o kadar karmaşıktır ki gelecekte ne olacağını tahmin etmek imkansızdır. Bu durumda karar ağacının doğruluğu da düşecektir. Fazla Uydurma - Karar ağacı, verilerin benzersizliğini yakalayamayabilir ve bu nedenle bir genelleme olarak kabul edilebilir. Ağacı ayarlamak için aynı veriler kullanılırsa, verilere fazla sığabilir.

Karar ağacı nasıl budanır?

Bir karar ağacı, bir dal ve sınır algoritması kullanılarak budanır. Dal ve sınır algoritması, ağacın düğümlerini yineleyerek ve her yinelemede amaç fonksiyonunun değerini sınırlayarak karar ağacına en uygun çözümü bulur. Amaç fonksiyonu, karar ağacının işletme için değeridir. Her düğümde, algoritma ya ağacın bir dalını kaldırır ya da bir dalı yeni bir düğüme budar. En iyi yanı, optimal olmayan bir çözüme yol açsa bile bir dalın budanabilmesidir.