Genelleştirilmiş Doğrusal Modelin Neden Olağanüstü Bir Sentez Modeli Olduğunu Bilin!
Yayınlanan: 2020-11-17İçindekiler
Temelleri anlamak
GLM , Klasik Lineer Regresyon Modellerinden Hayatta Kalma Analizi Modellerine kadar farklı regresyon modelleriyle ilgilenen kişiler arasında çok ünlüdür. Genelleştirilmiş doğrusal model (GLIM veya GLM) terimi , McCullagh (1982) ve Nelder (2. baskı 1989) tarafından türetilmiş ve tanıtılmıştır. GLM , Rutherford 2001, Data = Model + Error'da açıklandığı gibi en basit haliyle. Çeşitli istatistiksel testlerin temeli olan kullanışlı bir çerçeveye sahiptir.
Model sınıfını yeniden gözden geçirme
- Lineer Regresyon modelleri olarak da adlandırılan Klasik Lineer Regresyon (CLR) Modelleri
- Varyans Analizi (ANOVA) modelleri.
- Makine arızası olasılığı gibi kazanma ihtimalini tahmin eden modeller
- Olay sayılarını açıklamak ve tahmin etmek için kullanılan modeller
- Bir bitkinin işlemcisi veya biyolojik yaşı vb. gibi canlı ve cansız varlıkların yaşam sürelerini tahmin etmeye yönelik modeller.
Genelleştirilmiş Doğrusal Model , adından da anlaşılacağı gibi, geliştirilmiş hesaplamalar ve yaklaşımlar ile yukarıda verilen tüm modeller için bir gölgelik gibidir.
Genelleştirilmiş Doğrusal Modellerin Yapısı
Genelleştirilmiş bir doğrusal model (veya GLM1) üç ana bileşenden oluşur:
- Rastgele Bileşen: Gürültü modeli veya hata modeli olarak bilinen rastgele bir bileşen, yanıt değişkeninin (Y) olasılık dağılımıdır.
- Sistematik Bileşen: Doğrusal bir öngörücü, aşağıda belirtildiği gibi, regresyonların doğrusal bir işlevidir:
ηi = α + β1Xi1 + β2Xi2 +···+ βkXik
- Bağlantı Fonksiyonu ( η veya g(μ) ile gösterilir ): Adından da anlaşılacağı gibi, sistematik ve rastgele bileşenler arasındaki bağlantı
Örnek : μi = E(Yi), doğrusal kestiriciye g(μi) = ηi = α + β1Xi1 + β2Xi2 +···+ βkXik
Genelleştirilmiş Doğrusal Model , maksimum olabilirlik süreciyle verilere uygulanır. Bu, regresyon katsayılarının tahminlerini ve katsayıların tahmini asimptotik standart hatalarını sağlar.

Sayım verileri için temel GLM , bir günlük bağlantısına sahip Poisson modelidir. Bununla birlikte, yanıt değişkeni bir sayı olduğunda, koşullu varyansı ortalamasından daha hızlı artar, aşırı dağılım olarak adlandırılan bir koşul üretir ve Poisson dağılımının kullanımını geçersiz kılar. Yarı-Poisson GLM , aşırı dağılmış sayım verilerini işlemek için bir dağılım parametresi ekler.

Genel anlamda, yarı-olasılık tahmini, verilerde kullanılan istatistiksel modelden beklenenden daha önemli değişkenlik olan aşırı dağılıma izin vermenin bir yoludur.
Benzer bir model, üstel bir aile olmayan negatif binom dağılımına dayanmaktadır. Genelleştirilmiş Doğrusal Modelde negatif-binomlar maksimum olabilirlikle belirlenemez. Sıfır şişirilmiş Poisson regresyon modeli, verilerde bir Poisson dağılımıyla tutarlı olandan daha fazla sıfır olduğunda en uygun olabilir.
Okuyun: Açıklanan Makine Öğrenimi Modelleri

Genelleştirilmiş Doğrusal Modelin geleneksel Sıradan En Küçük Kare (OLS) regresyonuna göre avantajları
Genel Doğrusal Modellerin OLS regresyonuna göre aşağıdaki gibi özetlenebilecek birçok avantajı vardır:
- OLS regresyonunun aksine, Y yanıtının normal dağılıma sahip olması için her seferinde dönüştürülmesi gerekmez.
- Bir bağlantı seçmek rastgele bir bileşen seçmekten farklı olduğundan modelleme daha esnektir.
- Bağlantı ek etkiler veriyorsa, sabit bir varyans gerekli DEĞİLDİR.
- Modeller Maksimum Olabilirlik tahmini ile eklendiğinden, tahmin edicilerin optimal özelliklerine sahibiz.
- Log-lineer ve lojistik regresyon modelleri için tüm çıkarım araçları ve model kontrolü, diğer GLM'ler için de geçerlidir.
- Bir yazılım paketinde, yukarıdaki tabloda listelenen tüm modelleri yakalamak için genellikle yalnızca bir süreç (prosedür veya işlev) bulunur; örneğin, glm() (R Dili) veya PROC GENMOD (SAS) alın.
Genelleştirilmiş Doğrusal Modelin Dezavantajları
Yukarıda sıralanan avantajların yanı sıra, bilinmesi gereken önemli iki dezavantajı vardır:
- Doğrusal işlev gibi bazı kısıtlamalar, sistematik bileşende yalnızca doğrusal bir tahmin ediciye sahip olabilir.
- Cevaplar birbirine bağlı olamaz.
Mutlaka Okuyun: Makine Öğrenimi Projesi Fikirleri Açıklandı
Çözüm
Yukarıdaki tüm bilgileri özetlersek, GLM'nin daha düşük karmaşıklıkla uygun olduğunu gördük. GLM ile yanıt değişkenleri herhangi bir üstel dağılım türüne sahip olabilir. Bunun dışında kategorik tahmin edicilerle de başa çıkabilir. Genel doğrusal model, yorumlanması kolay ilişkilendirilebilirliktir ve her bir tahmincinin sonucu nasıl etkilediğinin net bir şekilde anlaşılmasını sağlar.
Makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saat zorlu eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT- sunan IIIT-B & upGrad'ın Makine Öğrenimi ve Yapay Zeka PG Diplomasına göz atın. B Mezun statüsü, 5+ pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.
Poisson regresyon modeli nedir?
Genel bir doğrusal model, genelleştirilmiş bir doğrusal modelden nasıl farklıdır?
Genelleştirilmiş bir doğrusal modelin yaptığı varsayımlardan bazıları nelerdir?
GLM varsayımlarının çoğu, doğrusal regresyon modelleriyle karşılaştırılabilir, ancak bazı doğrusal regresyon varsayımları değiştirilir. Bir GLM'deki verilerin bağımsız ve rastgele olduğu varsayılır. Hatalar, düzenli olarak dağıtılmaları gerekmese de bağımsız olarak kabul edilir. Yanıt değişkeninin bağımsız olması gerekmese de, dağılım üstel aileye ait olmalıdır.