Yapay Zeka Mühendislerinin 2022'de Öğrenmesi Gereken En İyi Derin Öğrenme Modeli Türleri

Yayınlanan: 2021-01-01

İçindekiler

Tanıtım

Derin Öğrenme, denetimsiz ve denetimli dönüşüm, özellik çıkarma, sınıflandırma ve örüntü analizi için doğrusal olmayan bilgi işlemenin farklı katmanlarından yararlanan bir makine öğrenimi tekniğidir.

Doğrusal olmayan bir şekilde bilgi işleme söz konusu olduğunda, farklı hiyerarşik katmanlardan oluşur. Burada, bazı düşük seviyeli kavramlar, daha yüksek seviyeli kavramları tanımlama yeteneğine sahiptir. Denetimli öğrenme, bir eğitim seti olan makine öğrenmesinin bir şeklidir ve eğitim aşamasında sisteme girdi olarak bir dizi örnek sunulur.

Her girdi bir çıktı değeriyle etiketlendiğinden, sistem bir dizi girdi sağlandığında çıktıyı bilir. Denetimsiz öğrenmede ise girdiler ait olduğu sınıfla etiketlenmez. Dolayısıyla ortak özellikleri araştırarak ve içsel bilgilere dayalı olarak gerekli değişiklikleri yaparak verileri geliştirmek ve düzenlemek sistemin elindedir.

Yapay sinir ağları sığdır. Bu nedenle, görüntüler, doğal konuşma, bilgi alma ve insan benzeri bilgi işleme uygulamaları gibi günlük uygulamalarda bulunan karmaşık verilerle uğraşamazlar. Bu tür uygulamalar için derin öğrenme modelleri mükemmeldir. Derin öğrenmenin yardımıyla, bir makine için daha az çabayla veri kalıplarını sınıflandırmak, tanımak ve kategorize etmek mümkündür.

İlgili Makale: En İyi Derin Öğrenme Teknikleri

Derin Öğrenme Modelleri Türleri

Derin öğrenme modelleri gelişmektedir ve çoğu yapay sinir ağlarına dayanmaktadır. Bunlardan en önemlisi evrişimsel sinir ağlarıdır (CNN'ler). Ayrıca, derin üretici modellerde katman bazında düzenlenen gizil değişkenleri ve önerme formüllerini de içerir.

Otomatik kodlayıcılar

Farklı kodlama kalıplarından öğrenebilen bir yapay sinir ağıdır. Bir otomatik kodlayıcı, en basit haliyle bir girdi katmanına, gizli katmana veya bir çıktı katmanına sahip çok katmanlı bir algılayıcıya benzer. Çıktı katmanı, çıktı katmanıyla aynı sayıda düğüme sahiptir. Çıktı vektörüne dayalı olarak hedef değerleri tahmin etmez; bunun yerine, Otomatik Kodlayıcı girdisini tahmin edebilir. Bu öğrenme mekanizması şu şekilde özetlenebilir:

Her x girişi için,

Her gizli katmanda ve çıktı katmanında ileriye dönük bir geçişe izin vererek aktivasyonu hesaplayın
Hesaplanan değerler arasındaki sapmayı tespit etmek için uygun hata fonksiyonlarını kullanın
Hatayı geri yayarak ağırlıkları güncelleyin
Tatmin edici çıktı üretene kadar görevi tekrarlamaya devam edin

Gizli katman, girdi-çıktı düğümlerinden daha az düğüme sahipse, son gizli katmanın aktivasyonu, girdilerin sıkıştırılmış bir temsili olarak düşünülür. Gizli katman düğümlerinin sayısı daha fazlaysa, bir otomatik kodlayıcı kimlik işlevini öğrenecek ve çoğu durumda işe yaramaz.

Derin İnanç Ağı

Tipik çok katmanlı algılayıcıya sahip yerel minimum ve dışbükey olmayan amaç fonksiyonlarını ele almak için bir çözüm sağlar. Bunu, diğer katmanlarla birbirine bağlı birden çok gizli değişken katmanından oluşan alternatif bir derin öğrenme türü olarak düşünebilirsiniz. Boltzmann makinelerinin kısıtlı bir versiyonudur.

Burada, her bir alt ağın gizli katmanları, ağın bitişik katmanı için görünür girdi katmanı olarak hizmet edecektir. Böylece en alttaki görünür katmanı ağın bitişik katmanı için bir eğitim seti yapar. Bu nedenle, ağın her katmanı açgözlü ve bağımsız olarak eğitilebilir. Derin yapının her katmanı, derin yapının her bir katmanını eğitmek için gizli değişkenleri gözlenen değişkenler olarak kullanır. Derin inanç ağını eğitmek için algoritma aşağıdaki gibidir:

Girdi vektörlerini dikkate alın
Bir Boltzmann makinesini eğitmek için girdi vektörünü kullanın ve ağırlık matrisini elde edin
Ağın iki alt katmanını eğitmek için ağırlık matrisini kullanın
Gizli birimlerin ortalama aktivasyonu ve örneklenmesi yoluyla yeni bir girdi vektörü oluşturmak için ağ RBM'sini kullanın.
Ağın en üst iki katmanına ulaşana kadar prosedürü tekrarlamaya devam edin.

Ayrıca Okuyun: Derin Öğrenme ve Sinir Ağları

Evrişimli Sinir Ağları (CNN)

İleri beslemeye dayalı çok katmanlı algılayıcının başka bir çeşididir. Bireysel nöronları, görsel alandaki örtüşen tüm bölgelere yanıt verecek şekilde düzenler. Girdi görüntüsü alabilen ve görüntüdeki çeşitli yönlerin/nesnelerin öğrenilebilir yanlılıklarına ve ağırlıklarına önem verebilen derin öğrenme algoritmalarından biridir.

Birini diğerinden ayırt edebilir. CNN'de ön işleme ihtiyacı diğer sınıflandırma algoritmaları ile karşılaştırıldığında oldukça düşüktür. CNN, bu özellikleri ve filtreleri öğrenme yeteneğine sahiptir.

CNN'ler aşağıdakiler için ana kategorilerden biridir:

Nesne algılamaları

Görüntü sınıflandırmaları

Görüntü tanıma

Yüz tanıma vb.

Bunlar, CNN'nin yaygın olarak kullanılabileceği birkaç alandan bazılarıdır.

Görüntü sınıflandırması için CNN bir giriş görüntüsünü kabul edecek, işleyecek ve farklı kategoriler altında sınıflandırma yapacaktır. Bilgisayarlar, girdi görüntülerini bir piksel dizisi olarak görselleştirir ve bu, görüntü çözünürlüğünün bir değişkenidir. Teknik olarak, CNN modelleri, her bir girdi görüntüsünü eğitim ve test için filtrelerle birlikte birkaç evrişimsel katmandan geçirecektir.

İlk katman, bir girdi görüntüsünden özellikleri çıkarmak için atanan Evrişim olarak bilinir. Evrişim, girdi verilerinin küçük karelerini kullanarak görüntü özelliklerini öğrenebildiği için pikseller arasındaki ilişkileri koruyabilir. İki girdi alarak matematiksel bir işlem yürütür: bir görüntü matrisi ve bir filtre veya çekirdek.

Bir görüntü evrişimi farklı filtrelerle sağlandığında, kenar algılama, keskinleştirme ve filtreler arasında bulanıklaştırma gibi işlemleri gerçekleştirme yeteneğine sahip olacaktır.

Son birkaç yılda, bilgisayarla görme alanı önemli ilerlemelere tanık oldu. En büyük gelişmelerden biri CNN'dir. Derin CNN'ler, jest tanıma, kendi kendine giden arabalar, Facebook'ta yayınlanan resimlerde arkadaşları otomatik etiketleme, yüz güvenlik özellikleri ve otomatik plaka tanımada kullanılan en sevilen bilgisayarlı görü uygulamaları haline geldi.

Tekrarlayan Sinir Ağları

Bir önceki adımın çıktısının mevcut adıma girdi olarak beslenebildiği bir tür sinir ağıdır. Geleneksel bir sinir ağındaki girdiler ve çıktılar birbirinden bağımsızdır. Ancak bir cümlede ardışık kelimeleri tahmin etmenin gerekli olduğu durumlarda, önceki kelimeleri hatırlama ihtiyacı olacaktır.

RNN'nin ortaya çıkması, bu sorunu gizli bir katman yardımıyla çözmeyi vaat ediyor. RNN'nin temel özelliklerinden biri, bir dizideki bazı bilgileri hatırlayabilen Gizli Durum'dur.

RNN, hesaplamalarla ilgili tüm bilgileri hatırlayabilen bir hafıza ile donatılmıştır. İstenen çıktıyı üretmek için tüm girdilerde veya gizli katmanlarda aynı görevleri gerçekleştirmek için her girdi için aynı parametreleri kullanabilir. Diğer sinir ağlarıyla keskin bir tezat oluşturan parametrelerin karmaşıklığını büyük ölçüde azaltacaktır.

Son düşünceler

Gradyanların hesaplanması sadece mevcut adıma değil, aynı zamanda önceki adıma da bağlıdır. Birkaç uygulama tarafından kullanılan çift yönlü tekrarlayan sinir ağı adı verilen bir varyant vardır. Burada ağ, önceki ve beklenen gelecekteki çıktıyı dikkate alır. Çoklu gizli katmanlar tanıtılarak, iki yönlü basit tekrarlayan sinir ağlarında derin öğrenme elde edilebilir.

Derin öğrenme teknikleri , makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, IIIT-B & upGrad'ın çalışan profesyoneller için tasarlanmış ve 240+ saatlik zorlu eğitim, 5+ vaka çalışması sunan Makine Öğrenimi ve Derin Öğrenmede PG Sertifikasına göz atın & atamalar, IIIT-B Mezunları durumu ve en iyi firmalarla iş yardımı.

Yapay Zeka Güdümlü Teknolojik Devrime Öncülük Edin

MAKİNE ÖĞRENİMİNDE PG DİPLOMASI VE YAPAY ZEKA

Daha fazla bilgi edin