Makine Öğrenimi için Lineer Cebir: Kritik Kavramlar, Neden Makine Öğrenimi Öncesi Öğrenilir
Yayınlanan: 2020-04-30Makine öğrenimi, robotik, veri bilimi, yapay zeka ve bilgisayarla görme, teknolojimizi şu anda bulunduğu seviyeye getirmede etkili olan alanlar arasındadır. Bu teknolojiler hakkında daha fazla bilgi edinmeye başladığınızda, bu teknolojilerde ortak olan bir dizi jargon veya belirli kelimelerle karşılaşacaksınız.
Bu terimlerden bazıları, diğerleri arasında kement regresyonu, KKT koşulları, çekirdek PCA, destek vektör makineleri (SVM), Lagrange çarpanları ve sırt regresyonu içerir. Şimdi, bu jargonlar sadece yabancıları uzak tutmak için uydurulmuş olabilir, ancak okuldaki günlerimizden bildiğimiz tipik lineer cebir ile ilişkileri hakkında çok şey söylüyorlar.
Bu nedenle, makine öğrenimi veya veri bilimi öğrenen her bireyin, önce lineer cebir ve optimizasyon teorisinin ne olduğu ile ilgili anlaşmaları zorunlu hale geliyor. Ayrıca, veri bilimini öğrenmeniz ve makine öğrenimi kullanarak sorunları çözerken veya veri bilimini kullanarak mevcut olan muazzam verileri daha anlamlı hale getirirken bunları nasıl kullanacağınızı bilmeniz gerekir.
Bu blogda, makine öğrenimi ve lineer cebirin nasıl ilişkili olduğuna ve ikincisini daha iyi anlamanın birincisinde ustalaşmanıza nasıl yardımcı olabileceğine odaklanacağız.
Makine öğreniminde SVM ve regresyon gibi lineer cebir bağlantılarının farkında değilseniz tam olarak anlayamayacağınız kavramlar vardır. Bunların gerçekte ne olduğunu bilmek için bu kavramlardan geçiyorsanız ve onların çalışmalarını daha fazla sürdürmek istemiyorsanız, lineer cebire ve bunun makine öğrenimi ile nasıl ilişkili olduğuna derinlemesine girmeden gidebilirsiniz.
Ancak, ileriye dönük makineler yetiştirecek veya araştırma yapıp bu alana önemli katkılarda bulunacak bir makine öğrenimi mühendisi olmayı planlıyorsanız, derinlere inmek zorunda kalacaksınız. Başka alternatif yok. Doğrusal cebirde sağlam bir geçmişe sahip olmak şarttır. Bu blogu yazmamızın temel amacı, lineer cebirin temellerini önünüze koyarak, onların makine öğreniminde nasıl kullanıldığını sunduğumuzdan emin olmaktır. Doğrusal cebirin tam olarak ne olduğunu anlayarak başlayalım.

İçindekiler
Lineer Cebir nedir?
Basit bir deyişle, mühendislik ve bilimde önemli uygulamalar bulan bir matematik dalıdır. Bu kadar önemli olmasına ve hayal gücümüzün çok ötesine geçen uygulamalara sahip olmasına rağmen, konu daha derin bir anlayışa geldiğinde bilim adamlarımızın geride kaldığını görüyoruz. Bunun arkasındaki ana sebep, çoğu bilim insanının sık sık kullandıklarını bulduğumuz ayrık matematiğin olmamasıdır.
Bilim adamları ve teknoloji alanında çalışan insanlar için daha az ilgi çekici kılan matematiğin sürekli kısmına aittir. Şimdi bir şeyi çok netleştirelim. Doğrusal cebirin nasıl çalıştığına dair temel bir anlayışınız bile yoksa, derin öğrenme de dahil olmak üzere çeşitli makine öğrenimi algoritmalarını öğrenmeyi ve kullanmayı çok zor bulacaksınız.
Makine öğreniminin temel olarak nasıl çalıştığını ve algoritmalarını nasıl ve nerede kullanabileceğinizi bitirdiğinizde, matematik öğrenmeye biraz daha zaman ayırmanız gerekecektir. Bu, makine öğrenimi algoritmaları hakkında daha önce anlamadığınız birçok yeni şeyi anlamanıza yardımcı olacaktır. Sınırlamaları, temel varsayımları ve diğer şeyler hakkında çok şey bileceksiniz.
Şimdi, makine öğrenimi ile daha fazlasını yapmayı öğrenmek için bu noktada çalıştığınız matematikte farklı alanlarla karşılaşacaksınız. Diğer konuların yanı sıra geometri, cebir, matematik ve istatistik üzerinde çalışabilirsiniz; ancak, burada akıllı olmanız ve deneyiminizi zenginleştirmenize gerçekten yardımcı olacağını düşündüğünüz alanı seçmeniz ve makine öğrenimi kariyerinizde ilerlerken size daha sağlam bir temel oluşturmanız gerekir. Hatta uzmanlardan bir karar vermenize yardımcı olmalarını isteyebilirsiniz.
Şimdi kendinize soracağınız bir sonraki soru, bu öğrenme sürecinde nasıl ilerlemeniz gerektiği olacaktır. Lineer cebiri sıfırdan çalışamazsınız. Makine öğreniminde kullanılan konuları bir şekilde seçip seçmeniz gerekecek. Bir sonraki bölümde, çalışmayı seçebileceğiniz lineer cebir konularından birkaçını tartışacağız.
Daha fazlasını öğrenin: Yeni Başlayanlar İçin Açıklanan En İyi 5 Makine Öğrenimi Modeli
Önemli Lineer Cebir Kavramları
Makine öğreniminin ardındaki temel kavramları anlamak istiyorsanız, birkaç lineer cebir kavramı hakkında yeterli bilgiye sahip olmak çok önemlidir. Bu gelişmiş makine öğrenimi algoritmalarının arkasındaki matematiği bilmiyorsanız, bunlar üzerinde bir ustalık geliştirmek isteyemezsiniz. Burada, makine öğreniminin nasıl çalıştığını bilmek için öğrenmeniz gereken birkaç lineer cebir kavramı verilmiştir.
1. Vektörler ve Matris
Bu iki kavramın, makine öğrenmesine olan yakın bağlılıklarını göz önünde bulundurarak öğrenmeniz gereken tartışmasız en önemli iki kavram olduğunu söylemek yanlış olmayacaktır. Vektörler bir dizi sayıdan oluşurken, bir matris genellikle büyük harflerle belirtilen 2 boyutlu vektörlerden oluşur.
Şimdi bunların makine öğrenme algoritmalarıyla nasıl bağlantılı olduğunu görelim. Vektörler, hedef değişkenler şeklinde bulundukları denetimli makine öğrenimi algoritmalarında kendilerini yararlı bulurlar. Öte yandan, verilerde bulunan özellikler matrisi oluşturur. Matris kullanarak bir dizi işlem gerçekleştirebilirsiniz - eşlenik, çarpma, sıralama, dönüştürme ve diğerleri. Aynı sayıda elemana ve şekil eşitliğine sahip iki vektör de çıkarma ve toplama yapmak için kullanılabilir.
2. Simetrik Matris
Simetrik matris, hem lineer cebirde hem de makine öğrenmesinde önem taşır. Lineer cebir matrisleri çoğunlukla fonksiyonları taşımak için kullanılır. Çoğu zaman, bu fonksiyonlar simetriktir ve onlara karşılık gelen matrisler de simetriktir. Bu fonksiyonlar ve sahip oldukları değerler, özellik mesafesini ölçmek için kullanılabilir. Özellik kovaryansını ölçmek için de kullanılabilirler. Aşağıda simetrik matrislerin birkaç özelliği listelenmiştir:
- Simetrik matrisler ve tersi simetriktir.
- Özdeğerlerdeki tüm değerler reel sayılardır. Karmaşık sayılar mevcut değildir.
- Bir matris, devrik değeriyle çarpıldığında simetrik bir matris oluşur.
- Simetrik matrisler ayrıca çarpanlara ayırma özelliğini de taşır.
- Doğrusal olarak bağımsız sütunları olan matrisler için, matris devrik ile çarpıldığında elde edilen sonuç tersine çevrilebilir.
3. Özdeğerler ve Özvektör
Özvektörler, yalnızca skaler bir faktörle değişen vektörlerdir ve yönlerinde hiçbir değişiklik yoktur. Özvektörlere karşılık gelen özdeğer, ölçeklendikleri büyüklüktür. Özdeğerler ve özvektörler, matematik ve hesaplamanın temellerinde bulunur. Bir XY grafiğine bir vektör çizdiğimizde, belirli bir yönü takip eder. Lineer dönüşümü birkaç vektöre uyguladığımızda yönlerinin değişmediğini görüyoruz. Bu vektörler makine öğreniminde çok önemlidir.
Veri gürültüsünü en aza indirmek için özdeğerler ve özvektörler kullanılır. Bu ikisini, hesaplama açısından yoğun olduğu bilinen görevlerin verimliliğini artırmak için de kullanabiliriz. Aşırı takmayı ortadan kaldırmak için de kullanılabilirler. Özdeğerlerin ve özvektörlerin yararlı olduğu başka senaryolar da vardır.
Ses, metin veya görüntü verilerinin özelliklerini görselleştirmek oldukça zordur. Bu veriler genellikle 3 boyutlu olarak temsil edilir. Bu, özdeğerlerin ve özvektörlerin resme girdiği yerdir. Bir matriste depolanan tüm büyük miktarını yakalamak için kullanılabilirler. Yüz tanımada da özdeğerler ve özvektörler kullanılır.

Okuyun: Yeni Başlayanlar için Makine Öğrenimi Proje Fikirleri
4. Temel Bileşen Analizi (PCA)
Belirli makine öğrenimi problemlerinin çözümü söz konusu olduğunda boyutluluğun işleri zorlaştırdığı birçok zaman vardır. Bu problemlerde, özellikleri kendi aralarında çok yüksek korelasyona sahip ve normalden daha yüksek bir boyutta olan verilerle ilgileniyoruz.
Bu boyutluluk sorunu ile ortaya çıkan sorun, her özelliğin hedef değişken üzerindeki etkisini anlamanın çok zor hale gelmesidir. Bunun nedeni, normalden daha yüksek korelasyona sahip özelliklerin hedefi aynı şekilde etkileme eğiliminde olmasıdır. Daha yüksek bir boyuttaki verileri görselleştirmek de çok zordur.
Temel bileşen analizi bu sorunların çözümüdür. Veri boyutunuzu 2 boyutlu veya 3 boyutlu hale getirmenize yardımcı olur. Bu, maksimum varyanstaki değişiklikler nedeniyle hiçbir bilginin kaybolmamasını sağlayarak yapılır. PCA'nın arkasındaki matematik, diklik ile ilgilidir. PCA, veri setindeki özelliklerin sayısını azaltarak modeli daha az karmaşık hale getirmek için mevcut en iyi yöntemdir.
Ancak, fazla takmayı ortadan kaldırmak için ilk adım olarak kullanmaktan kaçınmalısınız. Verilerdeki özelliklerin sayısını sınırlandırarak veya veri miktarını artırarak başlamalısınız. Daha sonra L1 veya L2 düzenlemesini kullanmayı denemelisiniz. Hiçbir şey işe yaramazsa, ancak o zaman PCA'ya dönmelisiniz.
Ayrıca şunu da okuyun: Bilmeniz Gereken En İyi 9 Makine Öğrenimi Kitaplığı
Makine öğreniminden önce neden lineer cebir öğrenmelisiniz?
1. Doğrusal cebir, makine öğreniminde mükemmel olmanın anahtarıdır
İleri matematik söz konusu olduğunda, kalkülüsün lineer cebirden üstün olduğu gerçeği inkar edilemez. İntegral ve diferansiyel hesap size sadece entegrasyon, türev alma ve limitlerden çok daha fazla yardımcı olur, ayrıca tensörler ve vektörler gibi uygulamalar için gerekli olan temel bilgi olarak da hizmet eder.
Bunları öğrenmek, diğer alanların yanı sıra lineer denklemleri ve lineer fonksiyonları daha iyi anlamanıza yardımcı olacaktır. Ayrıca Simplex yöntemi ve uzamsal vektörler gibi gelişmiş kavramlar hakkında bilgi sahibi olacaksınız. Doğrusal programlama konusunda yardıma ihtiyacınız varsa Simplex yöntemini kullanabilirsiniz. Bu kavramlarda daha iyi olmak için lineer cebire daha fazla zaman vererek başlayın.
2. Makine öğrenimi tahmini
Lineer cebir öğrendiğinizde, makine öğreniminde bu kadar önemli bir rol oynayan farkındalığı veya içgüdüyü geliştirirsiniz. Artık daha fazla bakış açısı sağlayabileceksiniz. Çalıştığınız matrisler ve vektörler, düşüncenizi genişletmenize ve onu daha sarsılmaz hale getirmenize yardımcı olacaktır. İmkanlar sonsuzdur. Çevrenizdeki diğerlerinin anlamakta çok zorlanacağı şeyleri yapmaya başlayabilirsiniz. Farklı grafikler oluşturmaya ve görselleştirmeye başlayabilirsiniz. Farklı makine öğrenimi bileşenleri için daha fazla parametre kullanmaya başlayabilirsiniz.
3. Doğrusal cebir, daha iyi makine öğrenimi algoritmaları oluşturmaya yardımcı olur
Daha iyi denetimli ve denetimsiz makine öğrenimi algoritmaları oluşturmak için lineer cebir öğrenmenizi kullanabilirsiniz. Lojistik regresyon, lineer regresyon, karar ağaçları ve destek vektör makineleri (SVM), lineer cebir yardımıyla sıfırdan oluşturabileceğiniz birkaç denetimli öğrenme algoritmasıdır.
Öte yandan, tek değer ayrıştırma (SVD), kümeleme ve bileşen analizi dahil olmak üzere denetimsiz algoritmalar için de kullanabilirsiniz. Doğrusal cebir, üzerinde çalıştığınız makine öğrenimi projesi hakkında daha derinlemesine bir anlayış geliştirmenize yardımcı olacak ve böylece size farklı parametreleri özelleştirme esnekliği sağlayacaktır. Makine öğreniminde Doğrusal regresyon hakkında daha fazla bilgi edinebilirsiniz .
4. Makine öğreniminde daha iyi grafik işleme için doğrusal cebir
Makine öğrenimi projeleri, üzerinde çalışmanız için size farklı grafik yorumlamalar sağlar - görüntüler, ses, video ve kenar algılama. Makine öğrenimi algoritmaları, verilen veri kümesinin bir bölümünü kategorilerine göre eğiten sınıflandırıcılara sahiptir. Sınıflandırıcıların bir diğer görevi, önceden eğitilmiş verilerdeki hataları ortadan kaldırmaktır.

Bu aşamada, bu karmaşık ve büyük veri setinin hesaplanmasına yardımcı olmak için lineer cebir devreye girer. Farklı projeler için büyük verileri işlemek ve işlemek için matris ayrıştırma tekniklerini kullanır. En popüler matris ayrıştırma yöntemleri QR ve LU ayrıştırmasıdır.
5. İstatistiklere bakışınızı geliştirmek için doğrusal cebir
İstatistikler, makine öğreniminde verileri düzenlemek ve entegre etmek için çok önemlidir. İstatistiksel kavramları daha iyi anlamak istiyorsanız, önce lineer cebirin nasıl çalıştığını bilmeniz gerekir. Doğrusal cebir, çok değişkenli analiz gibi gelişmiş istatistiksel konuları projenize entegre etmeye yardımcı olabilecek yöntemler, işlemler ve notasyonlara sahiptir.
Kilo, boy, kan basıncı ve kalp atış hızını içeren hasta verileri üzerinde çalıştığınızı varsayalım. Bunlar, üzerinde çalıştığınız veri kümesinin çoklu değişkenleridir. Burada ağırlık artışının kan basıncında artışa yol açacağını varsayalım. Bunun lineer bir ilişki olduğunu anlamak çok zor değil. Bu nedenle, bir değişkendeki artışın diğerini nasıl etkilediğini daha iyi anlamak için lineer cebir hakkında iyi bir anlayışa sahip olmanız gerekir.
Çözüm
Makine öğrenimi başlı başına oldukça geniş bir konudur; ancak, lineer cebir gibi öğrenilmesi en az makine öğreniminin kendisi kadar önemli olan başka kavramlar da vardır. Lineer cebir ve benzeri konuları öğrenmek, makine öğrenimi kavramlarını daha iyi anlamanıza yardımcı olacaktır.
Makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saat zorlu eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT- sunan IIIT-B & upGrad'ın Makine Öğrenimi ve Yapay Zeka PG Diplomasına göz atın. B Mezun statüsü, 5+ pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.
Makine öğrenimi için hangisi daha önemlidir - kalkülüs mü yoksa lineer cebir mi?
Makine öğreniminde bir kariyer yapmayı planlıyorsanız, bu alanın temellerinin matematiğin derinliklerinde yattığını zaten bilmelisiniz. Makine öğrenimi matematiği 3 temel alandan oluşur: kalkülüs, lineer cebir ve istatistik. Makine öğrenimi çok sayıda vektör ve matris içerdiğinden, lineer cebir en temel kısımlarını oluşturur. Ancak matematik, makine öğrenimi mekanizmasının nasıl çalıştığını anlamaya yardımcı olduğu için makine öğreniminin ayrılmaz bir parçasıdır. Dolayısıyla hem hesap hem de lineer cebir eşit derecede önemlidir. Ancak, her ikisinden de ne kadarını kullanmanız gerektiği, öncelikle iş rollerinize ve sorumluluklarınıza bağlıdır.
Lineer cebiri öğrenmek matematikten daha mı zor?
Doğrusal cebir tamamen doğrusal denklemleri kullanarak düz çizgileri çalışmakla ilgilidir, oysa hesap tamamen türevleri, vektörleri, integralleri, eğrileri ve daha fazlasını içeren düzgün şekilde değişen bileşenlerle ilgilidir. Bununla birlikte, lineer cebir öğrenmek, temel matematikten bile çok daha basittir. Lineer cebirde, lineer cebir teoremlerinin arkasındaki teoriyi anlayabilirseniz, ilgili tüm soruları çözebilirsiniz. Ancak bu, kalkülüs problemlerinin çözümünde yeterli değildir. Algoritmaları ezberlemekten daha fazlası, yani teori kısmı, kalkülüsteki hesaplama sorularını cevaplamak için hesaplama yönlerini anlamanız gerekir. Matematik, matematiğin en zorlu kısmıdır, lineer cebir ise daha somut ve daha az soyuttur; anlamak artık daha kolay.
Makine öğreniminde istatistik önemli midir?
Makine öğrenimi söz konusu olduğunda, istatistikleri bunun dışında bırakamazsınız. Uzmanlar, makine öğreniminin uygulamalı istatistik olduğu görüşündedir, bu nedenle makine öğrenimi alanında kariyer yapmak isteyenler için bir ön koşuldur. Makine öğrenimi modellerini tasarlarken, veriler temelde hayati bir rol oynar. Farklı makine öğrenimi modellerini eğitmek için kullanılacak birikmiş verilere dayalı yanıtları bulmak için istatistiksel tekniklere ihtiyaç vardır. Bu nedenle, makine öğrenimi için istatistiklerle temel bir aşinalık zorunludur.