Python'da Doğrusal Regresyon Uygulaması: Eksiksiz Bir Kılavuz

Yayınlanan: 2019-11-18

Python ile makine öğrenimi veya istatistik çalışıyor olsanız da, doğrusal regresyonla karşılaşırsınız. Doğrusal regresyon, makine öğrenimi sertifika kursunun önemli bölümlerinden biridir.

Bu ne? Python ile doğrusal regresyon nasıl yapılır?

Bu yazıda, bu soruların cevaplarını keşfedeceğiz. Bu makaleyi okuduktan sonra şunlara aşina olacaksınız:

  • Regresyonlar ve bunlar nelerdir
  • Doğrusal regresyon nedir
  • Doğrusal bir regresyon modeli nasıl eğitilir
  • Doğrusal regresyon uygulamaları

Başlayalım.

İçindekiler

Regresyon nedir?

Regresyon analizi, bağımlı ve bağımsız değişken arasındaki ilişkileri tahmin etmek için kullandığınız belirli istatistiksel süreçleri ifade eder.

Finans ve bankacılık gibi birçok sektörde popülerdir. Regresyon analizini kullanarak, belirli bir ortamda iki değişken arasındaki ilişkiyi anlayabilirsiniz.

Belirli bir bölgedeki evlerin fiyatlarını bulmak istediğinizi varsayalım. Bu amaçla, bölgenin şehrini, sakinlerinin sayısını, olanakların mevcudiyetini ve diğer birçok şeyi gözlemlemeniz gerekecektir.

Evlerin fiyatlarının bağlı olacağı şeylere özellik denir. Ve faktörlerin her evin maliyeti ile ilgili olduğu sorunu bir gözlemdir. Bu örnekte, konumun, olanakların ve diğer faktörlerin her bir evin fiyatını etkilediği varsayılmaktadır.

Daha basit bir ifadeyle, regresyon analizinde belirli bir konuyla ilgili birkaç gözlem yaparsınız. Aralarında ilişki kurmaya başlamadan önce gözlemlerinizin birkaç özelliği ve bazı varsayımları vardır.

Regresyon analizinde iki tür özellik vardır. Onlar:

  • Bağımlı çıktılar, değişkenler veya yanıtlar olarak adlandırılan bağımlı özellikler
  • Bağımsız çıktılar, değişkenler veya yanıtlar olarak adlandırılan bağımsız özellikler

Genel olarak, bir regresyon probleminin bir sürekli bağımlı değişkeni vardır. Girişler değişir.

Çıktıları y, girdileri x ile belirtebilirsiniz. Bunun için kesin ve hızlı kurallar yoktur, ancak bu çıktıları ve girdileri belirtmek için y ve x'i kullanmak genel bir uygulamadır.

Birden fazla bağımsız değişkeniniz varsa, x = (x1,…,xr) şeklinde temsil edebilirsiniz; burada r, girdi sayısını gösterir.

Kariyerinizi hızlandırmak için Dünyanın en iyi Üniversitelerinden - Yüksek Lisanslar, Yönetici Yüksek Lisans Programları ve Makine Öğrenimi ve Yapay Zekada İleri Düzey Sertifika Programından Çevrimiçi En İyi Makine Öğrenimi Kurslarını alın.

Doğrusal Regresyon Nedir?

Doğrusal regresyon, en popüler regresyon türüdür. Bağımlı bir çıktı ile bir grup bağımsız çıktı arasındaki ilişkileri modellemek için istatistiksel bir yöntemdir.

Bu makalede, bağımsız çıktılara 'özellikler' ve bağımlı çıktılara 'yanıtlar' diyeceğiz.

Doğrusal bir regresyon yalnızca bir özelliğe sahipse, buna Tek Değişkenli doğrusal regresyon denir. Benzer şekilde, birden fazla özelliği varsa, buna Çoklu doğrusal regresyon adını verirsiniz.

Doğrusal regresyonların en dikkate değer avantajı, sonuçlarını yorumlama kolaylığıdır. Lineer Regresyon Mülakat Soruları

Gerilemenin en basit şeklidir.

Hipotez

y tahmin edilen değerse, 0 sapma terimidir, xn ve özellik değerleridir ve lineer regresyon modelini aşağıdaki denklemle temsil edersiniz:

Y = 0 + 1 x 1 + 2 x 2 +…. + n x n

Burada n, model parametrelerini ifade etmektedir.

Doğrusal Regresyon Python Kodu

Doğrusal bir regresyon modeli oluşturmak için başlangıçta bir veri setine de ihtiyacınız olacak. Doğrusal regresyon için Python kodunu kullanmanın birden çok yolu vardır.

Bu konuda çalışmaya başlamadan önce Python okumanızı ve python kütüphanelerine aşina olmanızı öneririz.

Temel bir doğrusal regresyon modeli oluşturmanıza yardımcı olabilir.

Regresyon Modelinin Eğitimi

Model için gerekli parametreleri bulmanız gerekecek, bu yüzden verilere en uygun olanı. En uygun çizgiyi (veya regresyon çizgisini) bulmanız gerekecektir.

Regresyon doğrusu, gözlemlenen rakamlar ile tahmin edilen rakamlar arasındaki hatanın minimum olduğu çizgidir. Bu hataların bir diğer adı da artıklardır.

Hatayı ölçmek için maliyet fonksiyonunu tanımlamanız gerekir:

J ( ) = 1 2m ben=1 m (h( x ben ) – y ben ) 2

Burada h(x), daha önce tartıştığımız denklemle gösterilen hipotez fonksiyonunu temsil eder:

h(x) = 0 + 1 x 1 + 2 x 2 +…. + ben x ben

m, veri kümemizdeki toplam örnek sayısını ifade eder.

Bu denklemleri ve bir optimizasyon algoritmasını kullanarak doğrusal regresyon modelinizi eğitebilirsiniz.

Aşağıda tartıştığımız Python regresyon analizini gerçekleştirmenin birçok başka yöntemi vardır:

Python Paketleri ile Doğrusal Regresyon Gerçekleştirme

Yaygın ve temel bir Python paketi olan NumPy'yi kullanabilirsiniz. Yüksek performanslı işlemleri gerçekleştirmek için kullanılır. Açık kaynaklıdır ve birçok matematiksel rutine sahiptir.

Bununla ilgili daha fazla bilgi edinmek için NumPy kullanıcı kılavuzuna göz atabilirsiniz. NumPy tabanlı popüler bir Python kitaplığı olan scikit-learn hakkında da bilgi edinmeniz gerekir. Makine öğrenimi ve benzeri etkinlikler için yaygın olarak kullanılmaktadır.

Doğrusal regresyon modelleri geliştirmek ve bunları uygulamak için istatistik modellerini de öğrenmelisiniz. Testleri gerçekleştirmek ve istatistiksel modelleri tahmin etmek için kullanılan başka bir güçlü Python paketidir.

Lineer Regresyon Uygulamaları Nelerdir?

Doğrusal regresyon birçok endüstride kullanım alanı bulur. İşte birkaç lineer regresyon uygulaması:

1) Trendleri Anlamak

Doğrusal regresyon, şirketlerin pazar eğilimlerini anlamalarına yardımcı olabilir. Bu sayede stratejilerini daha iyi planlayabilir ve hata yapmaktan kaçınabilirler. Şirketlerin yanı sıra tüccarlar ve araştırma kuruluşları da trendleri değerlendirmek için bu tekniği kullanabilir.

2) Fiyat Değişikliklerini Analiz Etme

Emtialardaki fiyat değişiklikleri, üretim işletmelerinin karları üzerinde önemli bir etkiye sahip olabilir. Doğrusal regresyon, fiyat değişiklikleri ile bunlara katkıda bulunan faktörler arasındaki ilişkileri bulabildikleri için şirketlere bu görevde de yardımcı olabilir.

3) Risk Değerlendirmesi

Sigorta şirketleri ve yatırımcılar, anormallikleri bulmak için doğrusal regresyon kullanabilir. Yatırımcılar, zayıf yatırımlarını bulabilir ve buna göre stratejilerini planlarken riski azaltırlar.

Sonuç Düşünceleri

Doğrusal Regresyon, önemli AI algoritmalarından biridir ve umarız Python ile doğrusal regresyonla ilgili bu kılavuzu faydalı bulmuşsunuzdur. Python gerilemesi, yeni başlayanlar için oldukça göz korkutucu olabilir. Bu yüzden önce Python paketlerine ve algoritmalarına aşina olmanızı öneririz.

Makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saat zorlu eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT sunan IIIT-B & upGrad'ın Makine Öğrenimi ve AI'daki Yönetici PG Programına göz atın. -B Mezunu statüsü, 5'ten fazla pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.

Bu ikisini tek başına bilmek, lineer regresyonu uygulamada size büyük fayda sağlayacaktır.

Regresyonu ne zaman kullanırız?

Bir problemde birden fazla değişken mevcut olduğunda, hepsi arasındaki ilişkiyi anlamak isteyebiliriz. Belirli değişken çiftleri arasındaki potansiyel ilişkileri bulmak için matrisleri kullanabiliriz. Korelasyon yöntemlerini kullanarak, herhangi bir değişken çifti arasındaki doğrusal ilişkiyi ölçebiliriz. Ancak, birkaç değişken içeren karmaşık ilişkileri bulmak istediğimizde bu yöntem yeterli değildir. Bu gibi durumlarda, regresyon, birden çok değişken arasındaki karmaşık ilişkileri anlamada daha etkili bir yöntemdir. Regresyon, hangi değişkenlerin belirli bir yanıtı etkilediğini ve bunların belirli bir sonucu nasıl açıklayabileceğini bilmemize yardımcı olur.

Makine öğreniminde kaç tür regresyon kullanılır?

Regresyon, bir hedef değişken ile bir veya birkaç bağımsız tahmin değişkeni arasındaki gelecekteki sonuçları tahmin edebileceğimiz bir tekniktir. Regresyon, zaman serisi modelleme, tahmin etme ve farklı değişkenler arasındaki neden-sonuç ilişkilerini anlama için makine öğreniminde çok yaygın olarak kullanılır. Makine öğreniminde kullanılan farklı regresyon türleri, doğrusal regresyon, lojistik regresyon, sırt regresyonu, polinom regresyonu ve kement regresyonudur. Makine öğreniminde kullanılan daha fazla türde regresyon analizi yöntemiyle karşılaşabilirsiniz. Ancak bunlar, diğerleri arasında en yaygın olarak kullanılan yöntemlerdir.

Python kullanmanın avantajları nelerdir?

Python, makine öğreniminde en yaygın kullanılan programlama dillerinden biridir. Çeşitli avantajlarla birlikte gelir. İlk olarak, Python'un sözdizimi basittir. Öğrenmesi ve anlaması kolaydır, bu da hem yeni başlayanlar hem de deneyimli programcılar arasında oldukça popüler olmasını sağlar. Daha sonra, açık kaynaklıdır ve kullanımı ücretsizdir ve aktif geliştiriciler ve araştırmacılardan oluşan büyük bir toplulukla birlikte gelir. Python'un çekirdeğinde yerleşik olan kapsamlı işlev kitaplığı, geliştiricilere kapsamlı destek sunar, bu nedenle harici veya üçüncü taraf kitaplıklara bağımlı olmaya gerek yoktur. Ayrıca Python, C ve C++ gibi diğer bazı programlama dillerinden farklı olarak oldukça esnek ve sistemden bağımsızdır.