Makine Öğrenimi İçin Doğrusal Diskriminant Analizi: Bilmeniz Gerekenler?

Yayınlanan: 2020-05-22

Son yıllarda teknolojideki ilerleme, bağlı cihazların büyük miktarda veriyi işlemesini sağladı. Bununla birlikte, bu kadar büyük miktarda veriyle uğraşırken verilerin depolanması ve güvenliği hala büyük endişeler olmaya devam ediyor. Bu nedenle verileri doğru şekilde işlemek çok önemlidir. Genellikle zaman alıcı bir görev olabilir.

Bu, lineer diskriminant analizi veya LDA gibi veri boyutunu azaltma tekniklerinin devreye girdiği yerdir. Bu teknikler, veri güvenliğini ve gizliliğini sağlarken veri kümelerini çok daha iyi bir şekilde işlemenize yardımcı olabilir. Bu blogdaki odak noktamız, lineer diskriminant analizi veri boyutluluk azaltma tekniğini tartışmak olacaktır. Boyutsallık azaltma hakkında konuşarak başlayalım.

İçindekiler

Boyut azaltma nedir?

Dayandığı kavramın arka planını biliyorsanız, lineer diskriminant analizi tekniğini daha iyi anlayacaksınız. Çok boyutlu verilerle uğraşırken, birbiriyle ilişkili bir takım özelliklere sahip verileriniz var. Çok boyutlu verileri iki veya üç boyutlu olarak çizersek, boyut indirgeme tekniğini kullanırız.

Boyut azaltmanın yerine oldukça yaygın olarak kullanılan bir alternatif, diğerlerinin yanı sıra histogramlar, dağılım grafikleri ve kutu grafikleri kullanılarak verilerin çizilmesidir. Bu grafikler, belirli bir ham veri kümesindeki kalıpları bulmak için kullanılabilir. Ancak grafikler, verileri sıradan insanlar için deşifre etmesi kolay bir şekilde sunmaz. Ayrıca, birçok özelliğe sahip veriler, bu veri kümesindeki kalıpları tanımlamak için birkaç çizelgeye ihtiyaç duyacaktır.

LDA gibi veri boyutunu azaltma teknikleri, verileri çizmek için iki veya üç boyut kullanarak bu endişelerin üstesinden gelmeye yardımcı olur. Bu, teknik altyapıya sahip olmayan kişiler için bile anlamlı olacak şekilde veri sunumunuzda daha açık olmanızı sağlayacaktır.

Okuyun : 25 Makine Öğrenimi Mülakat Soruları ve Cevapları

Doğrusal diskriminant analizi nedir?

En çok kullanılan boyut küçültme tekniklerinden biridir. Modellerin sınıflandırılması ile ilgisi olan uygulamaların yanı sıra makine öğreniminde de kullanılır. LDA, yüksek boyutlu bir uzayda var olan özellikleri daha düşük bir boyutta uzaya yansıtmak olan çok özel bir amaca hizmet eder.

Bu, yaygın boyutluluk sorunlarını ortadan kaldırmak ve boyutsal maliyetleri ve kaynakları azaltmak için yapılır. Ronald A Fisher, 1936'daki orijinal konseptin –Fisher's Discriminant Analysis veya Linear Discriminant – geliştirilmesinin kredisini elinde tutuyor. Başlangıçta, lineer diskriminant iki sınıflı bir teknikti. Çok sınıflı versiyon daha sonra geldi.

Doğrusal diskriminant analizi, makine öğrenimi modelleri oluşturmak için kullanılan denetimli bir sınıflandırma yöntemidir. Boyut azaltmayı temel alan bu modeller, diğerlerinin yanı sıra, pazarlama tahmin analizi ve görüntü tanıma gibi uygulamada kullanılır. Uygulamaları biraz sonra tartışacağız.

Peki LDA ile tam olarak ne arıyoruz? Bu boyutluluk indirgeme tekniğinin keşfetmeye yardımcı olduğu iki alan vardır - Bir grup ve bir nesne arasındaki ilişkiyi açıklamak için kullanılabilecek parametreler - Grupları ayırmaya yardımcı olabilecek sınıflandırma öncü modeli. Bu nedenle LDA, farklı gruplardaki çeşitleri modellemek için yaygın olarak kullanılmaktadır. Yani bir değişkenin dağıtımı için iki veya ikiden fazla sınıf kullanmak için bu tekniği kullanabilirsiniz.

Doğrusal diskriminant analizinin uzantıları

LDA, sınıflandırma için mevcut en basit ve en etkili yöntemlerden biri olarak kabul edilir. Yöntem çok basit ve anlaşılması kolay olduğu için, bunun için mevcut uzantıların yanı sıra birkaç varyasyonumuz var. Bunlardan bazıları şunlardır:

1. Düzenli diskriminant analizi veya RDA

RDA, düzenlemeyi varyans veya kovaryans tahminine getirmek için kullanılır. Bu, değişkenlerin LDA üzerindeki etkisini azaltmak için yapılır.

2. İkinci dereceden diskriminant analizi veya QDA

QDA'da farklı sınıflar kendi varyans tahminlerini kullanır. Girdi değişkeninin sayısının normalden fazla olması durumunda, her sınıf kendi kovaryans tahminini kullanır.

3. Esnek diskriminant analizi veya FDA

FDA, doğrusal olmayan kombinasyonlara sahip girdileri kullanır. Spline'lar buna iyi bir örnektir.

Şunlar hakkında bilgi edinin: Python Proje Fikirleri ve Konuları

Ortak LDA uygulamaları

LDA, kullanımını çeşitli uygulamalarda bulur. Sınıflandırma problemine dönüştürülebilecek herhangi bir problemde kullanılabilir. Yaygın örnekler arasında hız tanıma, yüz tanıma, kimya, mikrodizi veri sınıflandırması, görüntü alma, biyometri ve biyoinformatik sayılabilir. Bunlardan birkaçını tartışalım.

1. Yüz tanıma

Bilgisayarla görmede yüz tanıma en popüler uygulamalardan biri olarak kabul edilir. Yüz tanıma, büyük miktarlarda piksel değerleri kullanılarak yüzleri temsil ederek gerçekleştirilir. LDA, sınıflandırma yöntemini kullanmak için zemin hazırlamak için öznitelik sayısını azaltmak için kullanılır. Yeni boyutlar, bir şablon oluşturmak için kullanılan piksel değerlerinin kombinasyonlarıdır.

2. Müşteri kimliği

Müşterileri bir ürünü satın alma olasılıklarına göre belirlemek istiyorsanız, müşteri özelliklerini toplamak için LDA'yı kullanabilirsiniz. Bir ürünü satın alma şansı daha yüksek olan müşteri grubunu tanımlayan özellikleri belirleyebilir ve seçebilirsiniz.

3. Tıbbi

LDA, hastalıkları şiddetli, hafif veya orta gibi farklı kategorilere ayırmak için kullanılabilir. Bu sınıflandırma görevini yürütmek için kullanılacak birkaç hasta parametresi vardır. Bu sınıflandırma, doktorların tedavinin hızını belirlemesine olanak tanır.

Ayrıca okuyun: Yeni Başlayanlar İçin 15 İlginç Makine Öğrenimi Projesi Fikri

Çözüm

LDA, ML modellerinin sınıflandırılmasında yaygın olarak kullanılan basit ve iyi anlaşılmış bir tekniktir. PCA ve lojistik regresyon, bizim için mevcut olan diğer boyutsallık azaltma teknikleridir. Ancak özel sınıflandırma problemleri söz konusu olduğunda, diğer ikisine göre LDA tercih edilir.

Makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saat zorlu eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT- sunan IIIT-B & upGrad'ın Makine Öğrenimi ve Yapay Zeka PG Diplomasına göz atın. B Mezun statüsü, 5+ pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.

Doğrusal diskriminant analizi nedir?

Linear Discriminant Analysis (LDA), bir grup numuneyi diğer tüm gruplardan ayırt etmek için iyi olan temel özellikleri öğrenmek için bir sınıflandırma algoritmasıdır. LDA algoritmasının uygulanması sonucunda, grup üyeliği tahmini için kullanılabilecek yeni bir özellik seti elde ederiz. Örneğin, diyelim ki IP adresleri topluyorsunuz ve hangi ülkeye ait olduklarını öğrenmek istiyorsunuz. Örnek IP adreslerinden oluşan bir eğitim setiniz var ve menşe ülkeyi çok yüksek bir doğrulukla tanımlayabilirsiniz. Yeni bir IP adresiniz varsa ve hangi ülkeden geldiğini bilmek istiyorsanız, bunu bir LDA'ya verebilirsiniz ve o da onu en yüksek olasılıkla sınıfa atayacaktır.

Doğrusal diskriminant analizinin uygulamaları nelerdir?

Lineer diskriminant analizi (LDA), denetimli öğrenme çerçevesindeki bir dizi tekniktir. LDA, bağımlı değişkenin öznitelik uzayında lineer olarak ayrılabilir olduğu bir yöntemdir. LDA, Pazarlama, Finans ve diğer alanlarda müşteri profili oluşturma ve dolandırıcılık tespiti gibi bir dizi sınıflandırma görevini gerçekleştirmek için kullanılır. Örneğin, iki grup veri noktasını ayıran bağımsız değişkenlerin doğrusal bir kombinasyonunu bulmak istediğimizi düşünün. LDA, özellik alanındaki iki veri noktası grubu arasında maksimum ayrım üreten bağımsız değişkenlerin doğrusal bir kombinasyonunu bulur.

Boyut Azaltma Nedir?

Boyut azaltma, bir veri kümesindeki değişkenlerin sayısını azaltmak için bir dizi teknik anlamına gelir. En yaygın boyut azaltma tekniği Temel Bileşenler Analizidir (PCA). PCA, basitliği, matematiksel zarafeti ve yüksek istatistiksel özellikleri nedeniyle en popüler boyut azaltma tekniğidir. PCA, en az hatayla birlikte en fazla varyansı içeren ekseni belirleyerek bir veri kümesinin boyutsallığını azaltmak için kullanılır.