Evrişimsel Sinir Ağları: 2022'de Yeni Başlayanlar İçin Nihai Kılavuz
Yayınlanan: 2021-01-05Google'da hızlı bir "veri bilimi" araması, nasıl yapılacağını herkese açık bir şekilde ortaya çıkaracaktır.
alan son beş yılda popüler hale geldi. Veri bilimi ile birlikte yapay
zeka, makine öğrenimi ve derin öğrenme de popüler turlar yapıyor
bilgisayar bilimi alanı. Bu listeye en son eklenen evrişimsel sinirseldir.
ağlar— bilgisayarla görme alanından bir yenilik.
İçindekiler
Her şey nerede başladı?
Sinir ağları, 2012'de Alex Krizhevsky'nin ödülü kazandığında gerçekten bir hit oldu.
ImageNet yarışması o yıl. Bu yarışma bilgisayar olimpiyatlarına benziyor
Alex bunları kullandığında sınıflandırma hatası %26'dan %15'e düştü.
Bu, şirketlerin ve bilgisayarın
bilim adamlarına ihtiyaç var. O zamandan beri Instagram, Facebook, Pinterest vb.
için en iyi deneyimi sağlamak için sinir ağlarını coşkuyla uygulamıştır.
onların seyircisi. Okuyun: Sinir Ağı Eğitimi.
Evrişimli sinir ağlarının biyolojik bağlantısı da
temel temiz. 1962'de Hubel ve Wiesel, beyindeki farklı nöronların olduğunu gösterdi.
görsel korteks, yalnızca belirli görsel ipuçları mevcut olduğunda ateşlendi. Birlikte, bunlar
nöronlar sütunlu bir yapıya sahipti ve ateşlendiğinde topluca görsel olarak üretildi.
algı.
Örneğin, bazı nöronlar yalnızca yatay kenarlara maruz kaldıklarında ateşlenirler.
Diğerleri dikey veya çapraz kenarların varlığında ateşlenir. Böylece farklı nöronlar
farklı görsel bileşenlere yanıt verdi ve görmemizi sağladı.
Evrişimsel Sinir Ağı nedir?
CNN veya ConvNet olarak da adlandırılan evrişimli bir sinir ağı, Derin Öğrenmedir.
algoritma. Bir girdi görüntüsü alır, bileşenlerine ağırlıklar/önyargılar atar.
görüntü ve ardından tüm görüntüyü sınıflandırır. Yeterli eğitimle ConvNet'ler
filtreleri/sınıflandırmayı öğrenme yeteneğine sahiptir ve gerekli ön işleme,
diğer algoritmalarla karşılaştırıldığında. Derin öğrenme ve sinir ağları arasındaki farkları okuyun.

Nihayetinde bir evrişimsel sinir ağının yapmasını istediğimiz şey, farklılaşmaktır.
görüntüler arasında bulun ve doğru şekilde sınıflandırın. Hem zamansal hem de
ilgili filtrelerin uygulanması nedeniyle uzamsal bağımlılıklar.
Nasıl Çalıştığına İlişkin Temel Bilgiler
Görüntü, görüntünün çözünürlüğüne ve boyutuna bağlı olarak bir dizi haline gelir.
Dizideki her giriş, 0 ile 255 arasında bir sayıdan oluşacaktır (RGB sistemi
Kullanılmış). Bu sayı, o noktadaki piksel yoğunluğunu temsil edecektir.
Tüm bu sayıları girdi olarak alarak, bilgisayar bir sayı çıkaracaktır. Bu numara
belirli bir sınıfa ait bir görüntünün olasılığını belirtir (örneğin ev,
yol, otobüs, köpek, kedi vb.)
Bir CNN'nin Yapısı
Yukarıdaki resme bakarak, bir konvolüsyonda birçok katman olduğunu düşünebilirsiniz.
sinir ağı, ancak gerçekte sadece 3 ana ağ var. Bunlar şunları içerir:
1. Evrişim katmanı
2. Havuzlama katmanı
3. Tam bağlantılı katman
Bunların her birine daha derinden dalalım.

evrişim katmanı
Bu, evrişimli sinir ağının çekirdek katmanıdır. Parametreleri
bir dizi filtreden oluşur. Bu filtreler küçüktür, ancak filtrenin tüm derinliğini kapsarlar.
giriş hacmi
Evrişim katmanında gerçekleştirilen ana görev, üst düzey
özellikleri. İlki (yukarıdaki resimde gösterildiği gibi) düşük seviyenin çıkarılmasından sorumludur.
renk, kenarlar, vb. gibi seviye özellikleri. Sonraki evrişim katmanları,
üst düzey özellikler, böylece görüntünün tam olarak anlaşılmasına/incelenmesine yol açar.
Havuzlama Katmanı
Bu katman, görüntü temsilinin uzamsal boyutunu küçültmek içindir. Bunun gibi,
ayrıca sinir ağındaki hesaplama ve işlem miktarını azaltmaya yardımcı olur.
Ek olarak, konumsal ve rotasyonel olan baskın özellikleri de çıkarır.
değişmez.
Bir tür havuzlama, Max işlemi kullanılarak yapılır. Bu işlem seçer
önceki katmandaki her nöron kümesinden maksimum değer. Diğer havuzlama türü
kümeden ortalama bir değer döndüren Ortalama havuzlamadır.
Maks havuzlama aynı zamanda bir gürültü bastırıcı görevi gördüğünden, Ortalamadan daha iyi performans gösterir.
havuzlama.
Yukarıdaki resimde gösterildiği gibi, ek olarak birden fazla havuz katmanı vardır.
evrişim katmanları. Bu katmanların sayısı arttıkça, daha düşük seviyeli özellikler
çıkartılacaktır. Bununla birlikte, harcanan hesaplama gücü de artacaktır.
Artık görüntü, mevcut tüm evrişimsel ve havuzlama süreçlerinden geçtiğine göre
katmanlar, özellik çıkarma tamamlandı. Şimdi görüntünün sınıflandırılması zamanı. Tam Bağlantılı Katman bu görevi yerine getirir.
Tam Bağlantılı Katmanlar (FCL)
Son katman olarak, FC katmanı basitçe ileri beslemeli bir sinir ağıdır. giriş
tam bağlı katman, son havuzlama/evrişimin düzleştirilmiş çıktısıdır
katman. Düzleştirmek, 3 boyutlu matrisin veya dizinin bir vektöre açılması anlamına gelir.

Her FC katmanı için belirli bir matematiksel hesaplama yapılır. Vektör, tamamen bağlı tüm katmanlardan geçtikten sonra, son katmanda softmax aktivasyon fonksiyonu kullanılır. Bu, belirli bir göreve ait girdinin olasılığını hesaplamak için kullanılır.
Böylece, nihai sonuç, farklı sınıflara ait girdi görüntüsünün farklı olasılıklarıdır.
İşlem, farklı görüntü türleri ve bu türlerdeki bireysel görüntüler için tekrarlanır. Bu, ağı eğitir ve ona bir köpek ile bir kedi ve bir gül ile bir ayçiçeği arasında ayrım yapmayı öğretir.
Götürmek
Evrişimli sinir ağlarının altında yatan teknoloji sürekli olarak geliştirilmektedir. Ağlar, doğru olasılıkları ortaya çıkarmak için yoğun bir şekilde eğitilmiştir. Haklı olarak söylenebilir: Bilgisayarla görü alanında CNN'ler tek başına bir devrimi heceliyor.
Pratik uygulamalı atölye çalışmaları, bire bir sektör danışmanı, 12 vaka çalışması ve ödev, IIIT-B Mezun statüsü ve daha fazlasını sağlayan Makine Öğrenimi ve Yapay Zeka alanında PG Diplomamızı inceleyebilirsiniz.