Lojistik Regresyon Mülakat Soruları ve Cevapları [Yeni Başlayanlar ve Deneyimliler İçin]

Yayınlanan: 2020-09-24

Makine öğrenimi, daha spesifik olarak sınıflandırma söz konusu olduğunda, lojistik regresyon belki de en basit ve en yaygın kullanılan algoritmadır. Lojistik regresyonu anlamak ve uygulamak çok kolay olduğundan, bu algoritma yeni başlayanlar ve makine öğrenimi veya veri bilimi yolculuğuna yeni başlayanlar için mükemmeldir.

Lojistik regresyon adı kulağa regresyonu uygulamak için kullanılabilecek algoritma gibi gelse de, gerçek bundan çok uzaktır. Lojistik regresyon, nüansları nedeniyle, örnekleri fiilen regresyon görevlerini yerine getirmekten çok iyi tanımlanmış sınıflara sınıflandırmaya daha uygundur.

Özetle, bu algoritma lineer regresyon çıktısını alır ve bize sonucu vermeden önce bir aktivasyon fonksiyonu uygular. Lojistik regresyonun kullandığı aktivasyon işlevi, sigmoid işlevidir (lojistik işlev olarak da bilinir). Bir sigmoid fonksiyonunun özelliklerine bağlı kalarak, sürekli değerler sağlamak yerine sadece sıfır ve bir aralığında bir sayı verir. Bir eşik değeri belirledikten sonra, lojistik regresyon çıktısından sınıflandırma yapmak çocuk oyuncağı olur.

Hepimiz veri bilimi ve makine öğrenimi alanının nasıl geliştiğini biliyoruz. Her gün daha fazla fırsat yaratılıyor. Dolayısıyla, bu rekabetin acımasız dünyasında, doğru bilgiye sahip olduğunuzdan emin olmak, hayallerinizdeki şirkette iyi bir yerleşim sağlamanın anahtarıdır. Bu çabanızda size yardımcı olmak için, profesyonel bir veri bilimcisi veya makine öğrenimi uzmanı olma yolculuğuna hazırlanmanıza yardımcı olacak bir lojistik regresyon görüşme soruları listesi hazırladık.

İçindekiler

Lojistik Regresyon Mülakat Soruları ve Cevapları

S1. DOĞRU veya YANLIŞ kullanarak yanıtlayın. Lojistik regresyon, bir tür denetimli makine öğrenimi algoritması mı?

Ans. Evet, bu sorunun cevabı DOĞRU olacaktır çünkü aslında lojistik regresyon denetimli bir makine öğrenimi algoritmasıdır. Basit neden, bu algoritmanın çalışma biçiminde yatmaktadır. Lojistik regresyondan çıktı almak için önce onu verilerle beslemeniz gerekecek.

Onlardan öğrenebilmesi ve doğru tahminlerde bulunabilmesi için örnekleri ve bu örneklerin doğru etiketlenmesini sağlamanız gerekecektir. Denetimli bir makine öğrenimi algoritması, başarılı bir şekilde eğitebilmek ve tahminlerde bulunabilmek için hem bir hedef değişkene (Y) hem de sınıf örneklerine veya girdi bilgilerini (X) sağlamak için kullanılan değişkene ihtiyaç duyacaktır.

S2. DOĞRU veya YANLIŞ kullanarak yanıtlayın. Lojistik regresyon esas olarak sınıflandırma için mi kullanılıyor?

Ans. Evet, bu sorunun cevabı DOĞRU. Aslında, lojistik regresyon, gerçek regresyon yapmaktan ziyade öncelikle sınıflandırma görevleri için kullanılır. Regresyon için doğrusal regresyon kullanıyoruz. İkisi arasındaki benzerlik nedeniyle, kafa karıştırmak kolaydır. Bu hatayı yapmayın. Lojistik regresyonda, sınıflandırma görevlerini çok daha rahat hale getiren sigmoid aktivasyon fonksiyonundan başka bir şey olmayan lojistik fonksiyonu kullanıyoruz.

S3. Bu soruyu DOĞRU veya YANLIŞ kullanarak yanıtlayın. Lojistik regresyon algoritmasının davranışını taklit eden bir sinir ağı uygulanabilir mi?

Ans. Evet, cevap DOĞRU olacaktır. Sinir ağları aynı zamanda evrensel yaklaşımcılar olarak da bilinir. Neredeyse tüm makine öğrenme algoritmalarını taklit etmek için kullanılabilirler. Bir şeyleri perspektife sokmak için, TensorFlow 2.0'ın Keras API'sini kullanıyorsanız, tek yapmanız gereken sıralı modele bir katman eklemek ve bu katmanı bir sigmoid etkinleştirme işleviyle yapmak olacaktır.

S4. Bu soruyu DOĞRU veya YANLIŞ kullanarak yanıtlayın. Çok sınıflı bir sınıflandırma problemini çözmek için lojistik regresyon kullanabilir miyiz?

Ans. Kısa cevap DOĞRU olacaktır. Ancak uzun cevap, sizi biraz düşündürür. Tek bir lojistik regresyon modelini kullanarak çok sınıflı bir sınıflandırmayı uygulamanın hiçbir yolu yoktur. Giriş değişkeninizin birçok sınıfını başarılı bir şekilde tahmin etmek için softmax etkinleştirme işlevine sahip bir sinir ağı kullanmanız veya karmaşık bir makine öğrenimi algoritması kullanmanız gerekecektir.

Ancak, çok sınıflı bir sınıflandırma problemini çözmek için lojistik regresyonu gerçekten kullanmanın bir yolu vardır. Bu, bire karşı tüm yaklaşımını kullanmak olacaktır. Her biri sadece bir sınıfı tahmin eden n sınıflandırıcı (burada n sınıf sayısıdır) eğitmeniz gerekecektir. Dolayısıyla, üç sınıflı bir sınıflandırma durumunda (A, B ve C diyelim), iki sınıflandırıcıyı biri A'yı değil A'yı tahmin etmek için, bir diğeri B'yi değil B'yi tahmin etmek için ve son sınıflandırıcıyı eğitmeniz gerekecektir. C'yi değil C'yi tahmin etmek. O zaman, lojistik regresyondan başka bir şey kullanmadan çok sınıflı bir sınıflandırma yapabilmek için tüm bu üç modelin çıktılarını bir araya getirmeniz gerekecek.

S5. Aşağıdaki listeden seçeneklerden birini seçin. Eğitim verilerini lojistik regresyon algoritmasına sığdırmak için kullanılan temel yöntem nedir?

Jakar Mesafesi
Maksimum Olasılık
En Küçük Kare hatası
Yukarıda belirtilen seçeneklerden hiçbiri.

Ans. Cevap B. Doğrusal regresyonda kullanılan yöntemin aynısı olduğundan, En Küçük Kare hatası olan C seçeneğini seçmek kolaydır. Ancak lojistik regresyonda, eğitim örneklerini modele sığdırmak için En Küçük kareler yaklaşımını kullanmıyoruz; Bunun yerine Maksimum Olabilirlik kullanıyoruz.

Ödeme: Makine Öğrenimi Proje Fikirleri

S6. Aşağıdaki listeden seçeneklerden birini seçin. Lojistik regresyon modelinin doğruluğunu ölçmek için hangi metriği kullanamayız?

Alıcı işletim özellikleri eğrisi (veya AUC-ROC puanı) altındaki alan
günlük kaybı
Ortalama kare hatası (veya MSE)
Kesinlik

Ans. Seçmeniz gereken doğru seçenek C, yani Ortalama Kare Hatası veya MSE'dir. Lojistik regresyon algoritması aslında temel bir regresyon algoritmasından ziyade bir sınıflandırma algoritması olduğu için yazdığımız lojistik regresyon modelinin performansını belirlemek için Meas Square Error kullanamıyoruz. Bunun ana nedeni, modelden aldığımız çıktı ve bir sınıf örneğine anlamlı bir sayısal değer atayamamasıdır.

S7. Aşağıdaki listeden seçeneklerden birini seçin. AIC, lojistik regresyon modelinin performansını değerlendirmek için mükemmel bir ölçüm olur. AIC, doğrusal bir regresyon algoritmasının performansını belirlemek için kullanılan R-kare yöntemine çok benzer. Bu AIC hakkında gerçekte doğru olan nedir?

AIC puanı düşük olan model genellikle tercih edilmektedir.
AIC puanı çok yüksek olan model aslında tercih ediliyor.
Sadece AIC puanına göre model seçimi büyük ölçüde duruma bağlıdır.
Yukarıda belirtilen seçeneklerden hiçbiri.

Ans. AIC değeri en az olan model tercih edilir. Dolayısıyla sorunun cevabı A seçeneği olacaktır. Mümkün olan en düşük AIC değerine sahip modeli seçmemizin temel nedeni, modelin performansını düzenlemek için eklenen cezanın aslında uyumu teşvik etmemesidir. bitmek. Evet, AIC veya Akaike Bilgi Kriteri, değer ne kadar düşükse uyumun o kadar iyi olduğu ölçümdür.

Uygulamada, ne yetersiz (yani iyi genellenemez, çünkü seçtiğimiz model verilerde mevcut olan karmaşıklıkları bulmak için yeterince karmaşık değildir) ne de aşırı (modelin eğitime mükemmel bir şekilde uyduğu anlamına gelen) modelleri tercih ederiz. veri ve daha genel tahminler yapma yeteneğini kaybetti). Bu nedenle, hem eksik hem de fazla takmayı önlemek için oldukça düşük bir puan seçiyoruz.

S8. DOĞRU veya YANLIŞ kullanarak yanıtlayın. Verileri bir eğitim lojistik regresyon modeline beslemeden önce özellik sütunlarında bulunan değerleri standartlaştırmamız gerekiyor mu?

Ans. Hayır, lojistik regresyon modelini eğitmek için kullanmamız gereken özellik uzayında bulunan değerleri standartlaştırmamız gerekmiyor. Dolayısıyla bu sorunun cevabı YANLIŞ olacaktır. Algoritmanın bir değere yakınsamasını sağlamaktan sorumlu olan işleve (genellikle gradyan iniş) yardımcı olmak için tüm değerlerimizi standartlaştırmayı seçiyoruz. Bu algoritma nispeten basit olduğu için, aslında performansında önemli bir fark olması için ölçeklenecek miktarlara ihtiyacı yoktur.

Öğrenin: Yeni Başlayanlar İçin Açıklanan En İyi 5 Makine Öğrenimi Modeli

S9. Aşağıdaki listeden seçeneklerden birini seçin. Değişken seçimi görevini gerçekleştirmek için kullandığımız teknik hangisidir?

Sırt Regresyonu
LASSO regresyonu
Bahsedilen seçeneklerden hiçbiri
Hem LASSO hem de Ridge Regresyonu

Ans. Bu sorunun cevabı B. LASSO regresyonudur. Sebebi basit, LASSO regresyon fonksiyonunda tahakkuk eden l2 cezası, bazı özniteliklerin katsayısını sıfır yapma kabiliyetine sahiptir. Katsayı sıfır olduğundan, fonksiyonun nihai sonucu üzerinde herhangi bir etkisi olmayacakları anlamına gelir. Bu, bu değişkenlerin sandığımız kadar önemli olmadığı anlamına gelir ve bu şekilde LASSO regresyonu yardımıyla bir değişken seçimi yapabiliriz.

S10. Aşağıdaki listeden seçeneklerden birini seçin. Tura gelme ihtimalini öğrenmek için elinizde adil bir madeni para olduğunu varsayın. Hesaplanan şansınız ne olurdu?

Tura gelme olasılığı 0 olur mu
Tura gelme olasılığı 1 olur mu
Tura gelme olasılığı 0,5 olur mu?
Yukarıda belirtilen seçeneklerden hiçbiri.

Ans. Bu soruyu başarılı bir şekilde cevaplamak için, oranların anlamını ve tanımını anlamanız gerekir. Oranlar aslında iki olasılığın oranı olarak tanımlanır - belirli bir olayın gerçekleşme olasılığına olma olasılığı. Adil olan herhangi bir madeni para durumunda, tura gelme olasılığı ve tura gelmeme olasılığı aynıdır. Yani tura gelme ihtimali bir.

S11. Aşağıdaki seçeneklerden doğru cevabı seçiniz. Logit işlevi, oranlar işlevinin günlüğü olarak tanımlanır. Bu logit fonksiyonunun aralığının [0,1] etki alanında ne olduğunu düşünüyorsunuz?

(-sonsuz, +sonsuz)
(0, +sonsuz)
(-sonsuz, 0)
(0, 1)

Ans. Olasılık işlevi, kendisine iletilen değeri alır ve bir olasılığa dönüştürür. Yani herhangi bir fonksiyonun aralığı sıfır ile bir arasında sıkıştırılır. Bununla birlikte, olasılık fonksiyonu bir şey yapar, değeri olasılık fonksiyonundan alır ve aralığını sıfırdan sonsuza yapar.

Bu nedenle, günlük işlevine etkin girdi sıfırdan sonsuza kadar olacaktır. Bu etki alanındaki log fonksiyon aralığının tüm gerçek sayı doğrusu veya negatif sonsuzdan pozitif sonsuza kadar olduğunu biliyoruz. O halde bu sorunun cevabı A seçeneğidir.

Q12. Aşağıdaki listeden DOĞRU olduğunu düşündüğünüz seçeneği seçin:

Doğrusal regresyon durumunda hata değerlerinin normal bir dağılımı izlemesi gerekir, ancak lojistik regresyon durumunda değerlerin standart bir normal dağılımı izlemesi gerekmez.
Lojistik regresyon durumunda hata değerlerinin normal bir dağılımı izlemesi gerekir, ancak Doğrusal regresyon durumunda değerlerin standart bir normal dağılımı izlemesi gerekmez.
Hem Lineer regresyon hem de Lojistik regresyon durumunda hata değerleri normal bir dağılım izlemelidir.
Hem Lineer regresyon hem de Lojistik regresyon durumundaki hata değerlerinin normal bir dağılım izlemesi gerekmez.

Ans. Bu ifadeler grubundaki tek doğru ifade ilkidir. Yani sorunun cevabı A seçeneği olur.

S13. Aşağıdaki seçenekler listesinden doğru seçeneği(S) seçin. Diyelim ki herhangi bir veriye lojistik regresyon modelini uyguladınız. Aldığınız doğruluk sonuçları, eğitim seti için X ve test seti için Y'dir. Şimdi, modelinize daha fazla veri noktası eklemek istiyorsunuz. Peki size göre ne olmalı?

Eğitim verilerinde aldığımız Doğruluk X'in artması gerekiyor.
Eğitim verilerinden elde ettiğimiz Doğruluk X'in düşmesi gerekiyor.
Test verilerinden elde ettiğimiz Doğruluk Y'nin düşmesi gerekiyor.
Test verilerinden elde ettiğimiz doğruluk Y, artmalı veya aynı kalmalıdır.

Ans. Eğitim doğruluğu, büyük ölçüde, modelin daha önce gördüğü ve öğrendiği verilere uygunluğuna bağlıdır. Diyelim ki modele beslenen özniteliklerin sayısını artırıyoruz, eğitim doğruluğu X artıyor. Bu durumda, eğitim doğruluğu artacaktır, çünkü modelin, artan sayıda özellik ile verileri uygun şekilde sığdırmak için daha karmaşık hale gelmesi gerekecektir.

Oysa test doğruluğu ancak modele eklenen özelliğin mükemmel ve önemli bir özellik olması durumunda artacaktır ya da modelin test sırasındaki doğruluğu aşağı yukarı aynı kalacaktır. O halde bu sorunun cevabı hem A hem de D seçenekleri olacaktır.

S14. Lojistik regresyon açısından bire karşı hepsi yöntemiyle ilgili olarak aşağıdaki seçeneklerden doğru olanı seçiniz.

N sayıda sınıf arasında doğru sınıflandırma yapmak için toplam n modele ihtiyacımız var.
n sayıda sınıf arasında sınıflandırma yapmak için n-1 sayıda modele ihtiyacımız var.
N sayıda sınıf arasında başarılı bir şekilde sınıflandırma yapmak için yalnızca tek bir modele ihtiyacımız var.
Yukarıda belirtilen seçeneklerden hiçbiri.

Ans. n farklı sınıf arasında sınıflandırma yapmak için Bire karşı Tüm yaklaşımında n modele ihtiyacımız olacak.

S15. Aşağıdaki grafiğe bakın ve aşağıda listelenen seçeneklerden birini seçerek soruyu cevaplayın. Grafikte kaç tane yerel minimum görüyorsunuz?

Grafikte sadece bir yerel minimum var.
Bu grafikte iki yerel minimum vardır.
Bu grafikte üç yerel minimum vardır.
Bu grafikte dört yerel minimum vardır.

Ans. Grafiğin eğimi dört farklı noktada (grafiğin U şeklinde olduğu yerde) sıfır olduğundan, cevabın D olacağı şekilde dört yerel minimuma sahip olacağını söylemek güvenlidir.

Ayrıca Okuyun: Doğrusal Regresyon Vs. Lojistik regresyon

Sıradaki ne?

Makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saat zorlu eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT- sunan IIIT-B & upGrad'ın Makine Öğrenimi ve Yapay Zeka PG Diplomasına göz atın. B Mezun statüsü, 5+ pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.

Lojistik regresyonu öğrenmek zor mu?

Veri bilimi söz konusu olduğunda, farklı türdeki hesaplama problemlerini çözmek için hem lojistik hem de doğrusal regresyon yaygın olarak kullanılmaktadır. Ve veri bilimi alanında verimli bir şekilde çalışmak için, bu tür regresyon modellerinin her ikisini de anlamalı ve rahat olmalısınız. Lojistik regresyonun daha gelişmiş bir denklem modeli kullandığını isminden tahmin edebilirsiniz. Bu nedenle, doğrusal regresyona kıyasla öğrenmesi biraz daha zordur. Bununla birlikte, matematiğin nasıl çalıştığına dair temel bir anlayışınız varsa, R veya Python programlamasında paketler oluşturmak için bunun üzerine inşa edebilirsiniz.

Veri biliminde lojistik regresyon ne kadar önemlidir?

Başarılı bir veri bilimcisi olmak için, veri edinme ve işleme, verileri anlama ve bir model oluşturma, sonuçları değerlendirme ve dağıtma boru hattını anlamak çok önemlidir. Ve lojistik regresyon, tüm bu boru hattı konseptini anlamak için paha biçilmezdir. Lojistik regresyonu anladığınızda, otomatik olarak makine öğrenimi kavramlarına ilişkin çok daha iyi bir anlayış geliştirirsiniz. Ayrıca, bazen, özellikle doğrusal olmayan problemler için, sadece lojistik regresyon kullanarak oldukça karmaşık problemleri kolayca çözebilirsiniz. Lojistik regresyon, hayati bir istatistiksel araçtır ve istatistik, makine öğreniminin ayrılmaz bir parçasıdır. Ve eğer sinir ağlarını incelemek istiyorsanız, lojistik regresyonu bilmek mükemmel bir başlangıç sağlayacaktır.

Lojistik regresyon gerçekten faydalı mı?

Adına rağmen, lojistik regresyon, gerçekte regresyondan daha fazla bir sınıflandırma çerçevesidir. Makine öğreniminde ikili sınıflandırma problemlerini çözmek için kullanılabilecek daha verimli ve daha basit bir yöntem veya algoritma sunar. Bunu kolayca gerçekleştirebilir ve lineer olarak ayrılabilen sınıflar için mükemmel performans elde edebilirsiniz. Bununla birlikte, doğrusal olmayan birkaç karar sınırı olduğunda, lojistik regresyon düşük performans gösterme eğilimindedir. Bazı durumlarda, sinir ağları gibi daha kompakt algoritmaların daha verimli ve güçlü olduğu söylenir.