Kapsül Sinir Ağları: Nedir, Nasıl Çalışır, Mimari ve Bileşenler

Yayınlanan: 2020-04-03

Şeyleri nasıl tanırsınız? 'Onların' ve 'Onların' yazarsam, ikisini de 'Onların' olarak okur musunuz? Cevabınız muhtemelen evet olacaktır.

Beyniniz birincil özellikleri tanımlayabilir ve bir şeyleri tanımanıza yardımcı olabilir. Bu yüzden yüzleri kolayca fark edebilirsiniz. Kapsül sinir ağları benzer şekilde çalışır. Bu yazıda, bunların ne olduğuna ve nasıl çalıştıklarına bir göz atacağız. Makine öğrenimi algoritmalarıyla ilgileniyorsanız, bu makaleyi mutlaka beğeneceksiniz. Öyleyse başlayalım.

İçindekiler

Kapsül Sinir Ağı Nedir?

Bir kapsül sinir ağı, daha iyi tanıma ve segmentasyon gerçekleştirmek için biyolojik sinir ağlarının çoğaltılmasına odaklanır. Bunlar bir tür Yapay Sinir Ağıdır. Kapsül sinir ağlarının bir katmanının altında iç içe geçmiş bir katmanları vardır, 'kapsül' kelimesi bunu gösterir.

Bu ağlardaki kapsüller, bir nesnenin özelliklerinin parametrelerini belirler. Kapsül ağlarınızın bir yüz tanımlaması gerektiğini varsayalım. Kapsüller, belirli yüz özelliklerinin olup olmadığını belirlemeye odaklanacaktır. Sadece bununla sınırlı değiller. Ayrıca belirli bir yüzün özelliklerinin nasıl düzenlendiğini de kontrol edecekler. Böylece sisteminiz bir yüzü ancak kapsüller o yüzün öğelerinin doğru sırada olduğunu belirlediğinde tanımlayabilir.

Merak edebilirsiniz, bu özelliklerin sırasını nasıl belirliyorlar? Bu ağlar, onlara verdiğiniz girdi nedeniyle bunu yapabilir. Yüzlerce (hatta binlerce) görseli incelediklerinde bu görevi verimli bir şekilde yerine getirebilirler.

Daha fazla bilgi edinin: Sinir Ağları: Gerçek Dünyada Uygulamalar

Kapsül Ağları Nasıl Çalışır?

Şimdi bu ağların nasıl çalıştığına bir göz atalım. İlk olarak, kapsüller, girdi vektörleri ile ağırlık matrislerinin matris çarpımını gerçekleştirir. Bu bize birkaç düşük seviyeli ve yüksek seviyeli özellik arasındaki uzamsal ilişki hakkında bilgi verir.

Bundan sonra kapsüller bir ana kapsül seçer. Seçimi, bu makalenin ilerleyen kısımlarında tartıştığımız dinamik yönlendirme yoluyla yaparlar. Ebeveyn kapsüllerini seçtikten sonra, yönlerine bağlı kaldıklarında 0 ile 1 arasında sıkıştırılan vektörlerin toplamını bulurlar. Var olma olasılığı olarak koordinat çerçevesinin normunu ve anlaşmanın ölçüsü olarak kosinüs mesafesini kullanarak ezme gerçekleştirirsiniz.

Standart sinir ağları ile kapsül sinir ağları arasında önemli bir fark vardır. Kapsül ağları, bir görüntü hakkındaki temel bilgi parçalarını kapsüllemek için kapsüller kullanırken, standart sinir ağları bu amaç için nöronları kullanır. Kapsüller vektör üretirken, nöronlar sadece skaler miktarlar üretebilir. Bu nedenle, kapsüller bir yüzün (veya belirli bir özelliğin) yönünü belirleyebilir, ancak nöronlar yapamaz. Herhangi bir özelliğin yönünü değiştirirseniz, vektörün değeri aynı kalır, ancak yönü pozisyon değişikliğine göre değişir.

Kapsül ağları, küçük veri kümelerinde inanılmaz derecede iyi performans gösterir ve sağlam görüntülerin yorumlanmasını kolaylaştırır. Bunun dışında doku, konum ve poz dahil olmak üzere resmin tüm bilgilerini korurlar. Tek dezavantajı, geniş veri kümelerinden daha iyi performans gösterememeleridir.

Okuyun: Sinir Ağlarında 6 Tip Aktivasyon Fonksiyonu

Kapsül Sinir Ağının Mimarisi Nedir?

Bir kapsül ağının birincil iki bileşeni, bir kodlayıcı ve bir kod çözücüdür. Toplamda altı katman içerirler. Kodlayıcı ilk üç katmana sahiptir ve giriş görüntüsünü alıp bir vektöre (16 boyutlu) dönüştürme sorumluluğuna sahiptir. Kodlayıcının ilk katmanı, evrişimli sinir ağıdır ve resmin temel özelliklerini çıkarır.

İkinci katman, PrimaryCaps Ağıdır ve bu temel özellikleri alır ve bunlar arasında daha ayrıntılı desenler bulur. Örneğin, belirli vuruşlar arasındaki uzamsal ilişkiyi görebilir. Farklı veri kümeleri, PrimaryCaps Ağı'nda farklı sayıda kapsüle sahiptir; örneğin, MNIST veri kümesinde 32 kapsül bulunur. Üçüncü katman DigitCaps Ağıdır ve içinde bulunan kapsüllerin sayısı da değişir. Bu katmanlardan sonra kodlayıcı, kod çözücüye giden 16 boyutlu bir vektöre sahiptir.

Kod çözücünün birbirine bağlı üç katmanı vardır. 16 boyutlu vektörü alır ve sahip olduğu veriler yardımıyla aynı görüntüyü sıfırdan yeniden oluşturmaya çalışır. Bu sayede ağ bilgisine göre tahminlerde bulunabildiği için daha sağlam hale gelir.

Ayrıca okuyun: Python'da Tekrarlayan Sinir Ağı

CNN'deki Hesaplamalar

Matris Çarpımı

Birinci katman ile ikinci katman arasında matris çarpımı yapıyoruz. Bu, uzamsal ilişkilerin bilgisini kodlar ve kodlanmış bilgi, etiket sınıflandırmalarının olasılığını gösterir.

Skaler Ağırlıklar

Hesaplamaların bu aşamasında, alt düzey kapsüller, ağırlıklarını üst düzey kapsüllerin ağırlıklarına göre ayarlar. Bunu, yüksek seviyeli kapsüllerin ağırlıklarına uyacak şekilde yaparlar. Üst düzey kapsüller, ağırlık dağılımının grafiğini çıkarır ve geçilecek en büyük tahsisi kabul eder. Hepsi dinamik yönlendirme yoluyla birbirleriyle iletişim kurar.

Dinamik Yönlendirme

Dinamik yönlendirmede, alt kapsüller verilerini ana kapsüle gönderir. Hepsi verilerini kendilerine göre en uygun kapsüle gönderir ve verilerin çoğunu alan kapsül ana kapsül olur. Ana kapsüller anlaşmayı takip eder ve ağırlıkları buna göre atar.

Dinamik yönlendirmeyi anlamak için, bir evin kapsül ağı görüntülerini verdiğinizi varsayalım. Evin çatısının tanımlanmasında bazı sorunlarla karşılaşmaktadır. Böylece kapsüller görüntüyü, özellikle de sabit kısmını analiz eder. Duvarlar ve çatı ile ilgili evin çerçevesini koordine ederler.

Önce nesnenin ev olup olmadığına karar verirler ve daha sonra tahminlerini üst düzey kapsüllere gönderirler. Çatının duvarlarla ilgili çıkıntıları, düşük seviyeli kapsüllerden gelen diğer tahminlerle eşleşiyorsa, çıktı nesnenin bir ev olduğunu söylüyor. Bu, anlaşma yoluyla yönlendirme işlemidir.

Vektörden vektöre doğrusal olmama

Dinamik yönlendirme tamamlandığında, sistem bilgiyi sıkıştırır, yani bu bilgiyi sıkıştırır. Kapsülün belirli bir özelliği tanıyıp tanımama olasılığını verir.

Son düşünceler

Bu makaleyi okuduktan sonra, kapsül sinir ağlarını ve işlemlerini öğrenmiş olmalısınız. Yaptıklarının ne kadar faydalı olabileceğini de fark etmiş olmalısın.

Makine öğrenimi algoritmaları hakkında daha fazla bilgi edinmek istiyorsanız blogumuza göz atın. Orada bazı bilgili makaleler bulacaksınız.

Makine öğrenimi hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 450+ saat zorlu eğitim, 30'dan fazla vaka çalışması ve ödev, IIIT- sunan IIIT-B & upGrad'ın Makine Öğrenimi ve Yapay Zeka PG Diplomasına göz atın. B Mezun statüsü, 5+ pratik uygulamalı bitirme projesi ve en iyi firmalarla iş yardımı.

Transformatör sinir ağları nelerdir?

Bir sinir ağı bir dizi vektörü girdi olarak aldığında, onu (işleme kodlama denir) olarak adlandırılan bir vektöre değiştirir ve daha sonra onu başka bir diziye çözer, buna transformatör sinir ağı denir. Transformatör, düz dil metni, akustik sinyaller, genomik diziler ve zaman serisi verileri dahil olmak üzere sıralı verileri işlemek için birçok sinir ağı mimarisinde bulunan bir bileşendir. Transformatör sinir ağlarının en yaygın uygulaması doğal dil işlemedir.

Grafiksel sinir ağları nedir ve grafikler nasıl çalışır?

Grafik sinir ağları veya GNN'ler, grafik bağımlılığını temsil etmek için grafik düğümleri arasında mesaj iletimini kullanan sinir modelleridir. Bu ağlar doğrudan verilen grafik yapıları üzerinde çalışır. Basit bir deyişle, grafikteki her düğümün bir etiketi vardır ve etiket düğümlerini temel gerçeğe dayalı olarak tahmin etmek için bir sinir ağı kullanılır. GNN'ler son zamanlarda sosyal ağlar, bilgi grafikleri, öneri sistemleri ve hatta yaşam bilimleri dahil olmak üzere çeşitli disiplinlerde önem kazanmıştır.

Kapsüller, kapsül ağlarından farklı mıdır?

Kapsüller ve kapsül ağları terimlerinin her ikisi de derin öğrenmeye bağlıdır, ancak bunlar aynı şey değildir. Aktivite vektörleri, bir nesneninki gibi belirli bir öğenin örnekleme parametrelerini temsil eden bir nöron grubu, bir kapsül olarak bilinir. Bununla birlikte, kapsül ağlar, havuzlama işlemleri sürecinde veri kaybını en aza indirmek için coğrafi bilgileri ve diğer önemli hususları alabilen ağlardır.