Doğrusal Regresyon Modeli: Nedir ve Nasıl Çalışır?

Yayınlanan: 2020-12-16

İçindekiler

Tanıtım

Regresyon analizi, verileri modellemek ve analiz etmek için önemli bir araçtır; iki veya daha fazla değişken arasındaki ilişkiyi bulmak esastır. Regresyon, verilerin modellenmesine ve analiz edilmesine yardımcı olan bir eğri içine veri noktalarının yerleştirilmesine yardımcı olur. Regresyon, tahmine dayalı modellerin ve veri setlerinin değerlendirilmesi için değişkenleri farklı ölçeklerde ölçmeye ve karakterize etmeye izin verir.

Okumalısınız: Doğrusal Regresyon Projesi Fikirleri

Regresyon modeli

Model, verilerin temsilinde kullanılan katsayı değerlerini içerir. Bu katsayıları tahmin etmek için kullanılan istatistiksel özellikleri içerir; tüm standart sapmaların, kovaryansların ve korelasyonların bir birleşimidir. Tüm veriler mevcut olmalıdır.

Regresyon modeli, cevabı bu bilgi değerleri kümesi (y) için beklenen çıktı olan belirli bir bilgi değerleri (x) düzenlemesini konsolide eden doğrusal bir durumdur. Hem bilgi değerleri (x) hem de çıktı sayısaldır.

Doğrusal denklem, her bilgi değerine veya segmente, katsayı adı verilen ve büyük Yunanca Beta (B) harfiyle gösterilen bir ölçek faktörü tahsis eder. Aynı şekilde ek bir katsayı eklenir, bu da hatta ekstra bir fırsat düzeyi sağlar (örneğin iki boyutlu bir çizimde baştan sona gitmek) ve buna sıklıkla yakalama veya eğim katsayısı denir.

Örneğin, temel bir regresyonda (basit bir x ve basit bir y), modelin türü şöyle olacaktır:

y = B0 + B1*x

Birden fazla bilgimiz (x) olduğunda daha yüksek ölçümlerde, çizgi düzlem veya hiper düzlem olarak bilinir. Bu çizgiler boyunca tasvir, koşulun tipi ve katsayılar için kullanılan belirli niteliklerdir (örneğin, yukarıdaki modelde B0 ve B1).

Regresyon gibi bir nüksetme modelinin çok yönlü doğasını tartışmak beklenmedik bir şey değil . Bu, modelde kullanılan katsayıların sayısını ifade eder.

Bir katsayı sıfır olduğunda, bilgi değişkeninin model üzerindeki ve ardından model kullanılarak üretilen tahminden (0 * x = 0) etkisini yeterince ortadan kaldırır. Bu, katsayıların en büyük boyutunu sıkıştırarak ve bazılarını sıfıra indirerek nüks modellerinin çok yönlü doğasını azaltmak için öğrenme hesaplamasını değiştiren düzenlileştirme tekniklerine bakmanız durumunda geçerlidir.

Regresyon, bir ilişki kurmak için bir veya daha fazla değişkenin kullanıldığı düz bir çizgi ile en iyi şekilde temsil edilir.

Modelin arkasındaki mantık:

Regresyon modeli y=mx+c denklemini kullandığından

nerede y= bağımsız değişken

m= eğim

c= belirli bir çizgi için kesişme

Birden çok bağımsız değişkeni hesaplamak için, birden çok regresyon modeli uygulamaya geçirilecektir. İşte mükemmel işleyen bir model yaratma süreci

  1. Kitaplıkları İçe Aktar - Makine öğrenimi modellerinin uygulanması etrafında dönen temel parametreler vardır. İlk kütüphane, python'daki resmi makine öğrenimi kütüphanesi olduğu için sklearn'i içermelidir. Numpy, verileri dizilere dönüştürmek için kullanılır ve veri kümesi için dosyalara erişmek için Pandalar uygulanır.
  2. Göreceli veri kümesini yükleyin- Daha önce içe aktarılan bir Panda değişkeninin yardımıyla gerçekleştirilir.
  3. Değişkenleri ayırın - Dizi öğeleri için gerekli olan bağımsız değişkenlerin veya bağımlı değişkenlerin sayısını belirtin ve tanımlayın.
  4. Test ve eğitim verilerinin bölünmesi - Veri setinden alınan rastgele değerlere izin vermek ve bunları kolaylaştırmak için tüm veri seti eğitim ve test alanlarına bölünür.
  5. Doğru modeli seçin- Uygun seçim, aynı veri kümesinin diğer modellerle ima edildiği bir deneme-yanılma sürecini gerektirir.
  6. Çıktı tahmini- Model, bağımsız değişkenin test değerleri tarafından desteklenen bağımlı değişken üzerinde çalışır, bu modeller için yerleşik yöntemler, sunulan her değer için niteliksel matematik yapar.

Bu, doğrusal regresyon modelinin uygulanmasını başlatır. Doğrusal tahmin işlevleri, daha önce belirtildiği gibi ilişki modellemesi için uygulanır. Yanıtın koşullu ortalaması, modele yanıtın koşullu ortalamasını hareket ettirmek için gerekli tahmin edicileri verir.

Bu tür tahmin ve tahminin amacı, eşlik eden bir yanıt değeri eklemeden ek değişkenleri barındırmaktır; uygun model, bu yanıt için gerekli tahmini yapmak üzere uygulanacaktır.

Doğrusal regresyon modelleri, en çok tercihen, uygulamanın, örneğin sapmaları ve maliyet işlevlerini en aza indirerek başka yollar gerektirebileceği en küçük kareler yaklaşımıyla kullanılır. Genel doğrusal modeller, doğası gereği bir vektör olan ve doğrudan skaler olmayan bir yanıt değişkeni içerir. Modelleme sürecinde koşullu doğrusallığın hala pozitif olduğu varsayılır. Büyük bir ölçekte değişirler, ancak log-normal dağılımla ilgili olan çarpık dağılım olarak daha iyi tanımlanırlar.

Okuyun: Makine Öğreniminde Regresyon Modeli Türleri

uyarılar

İki değişkenin ilişkili olduğu göz önüne alındığında, bu, birinin diğerine neden olan özelliği dışlamaz.

Bir veri kümesi için doğrusal bir regresyon denklemi denenir ve çalışırsa, denklemin mükemmel bir uyum olduğu anlamına gelmez, benzer bir görünüme sahip başka yinelemeler olabilir. Tekniğin orijinal olduğundan emin olmak için denklemin doğrusallığını bulmak için veri noktalarıyla bir çizgi çizmeye çalışın.

Özetle

Doğrusal regresyon yönteminin, olasılıkları artırmaya ve konuyla ilgili iki veya daha fazla değişken arasındaki olayların ve ilişkilerin öngörülebilirliğini bulmaya olanak tanıyan çok daha iyi, güçlü ve istatistiksel bir yöntem sağladığı kanıtlanmıştır.

Makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saat zorlu eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT- sunan IIIT-B & upGrad'ın Makine Öğrenimi ve Yapay Zeka PG Diplomasına göz atın. B Mezun statüsü, 5+ pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.

Doğrusal bir regresyon modeli kullanırken karşılaşılabilecek bazı problemlerden bahsedin.

Doğrusal regresyon, bağımlı değişkenin ortalaması ile bağımsız faktörler arasındaki ilişkinin tahmin edilmesine yardımcı olur. Bu sorunlu hale gelir çünkü bazen bir sorunu çözmenin tek yolu bağımlı değişkenin uç değerine bakmaktır. Nicel regresyon ise bu sorunu çözmek için kullanılabilir. Ayrıca, doğrusal regresyon, sunulan verilerin bağımsız olduğunu varsayar; bu, kümeleme sorunları olması durumunda yanlıştır.

Regresyonda doğrusal korelasyon katsayısı nedir?

Korelasyon katsayısı, basit doğrusal regresyonda değişkenler arasındaki ilişkiyi analiz etmenin yalnızca bir yönüdür. Aslında, en güçlü ve yaygın olarak kullanılan istatistiksel analiz yöntemlerinden biridir. Temelde iki değişkenin ne kadar yakından bağlantılı olduğunu bize bildiren bir istatistik olan Pearson moment çarpım korelasyon katsayısı en sık kullanılan korelasyon katsayısıdır. Doğrusal korelasyon katsayısı, iki değişken arasındaki doğrusal ilişkinin gücünü değerlendirir. Mükemmel doğrusal bağlantı, bir değişkendeki değişikliğin diğer değişkende aynı birim değişikliğine neden olduğu bağlantıdır.

Regresyon analizi herhangi bir işte nasıl yardımcı olur?

Regresyon analizi, bir kuruluşun veri noktalarının neyi temsil ettiğini anlamasına ve daha iyi kararlar almak için iş analitik yaklaşımlarını bunlara uygulamasına yardımcı olur. Bu gelişmiş istatistiksel araç, gereksiz değişkenleri ortadan kaldırmak ve en alakalı olanları seçmek için iş analistleri ve veri uzmanları tarafından kullanılır. Kuruluşlar, tahmin etme veya bir hipotez varsayma gibi eski okul tekniklerini ortadan kaldıran ve sonuç olarak iş performansını artıran veriye dayalı karar verme kullanıyor.