Convolutional Neural Networks: Panduan Utama untuk Pemula di 2022

Diterbitkan: 2021-01-05

Pencarian cepat "ilmu data" Google akan dengan jelas mengungkapkan kepada siapa pun caranya
populer bidang telah menjadi dalam lima tahun terakhir. Seiring dengan ilmu data, artifisial
kecerdasan, pembelajaran mesin, dan pembelajaran mendalam juga melakukan putaran populer di
bidang ilmu komputer. Yang terbaru ditambahkan ke daftar ini adalah saraf convolutional
jaringan— sebuah inovasi dari bidang visi komputer.

Daftar isi

Di mana semuanya dimulai?

Jaringan saraf benar-benar menjadi hit pada tahun 2012 ketika Alex Krizhevsky memenangkan
Kompetisi ImageNet tahun itu. Kompetisi ini mirip dengan Olimpiade komputer
visi dan ketika Alex menggunakannya, kesalahan klasifikasi turun dari 26% menjadi 15%.

Ini adalah Sinar Laser Harapan yang Tak Terduga yang dimiliki oleh perusahaan dan komputer
dibutuhkan ilmuwan. Sejak itu, perusahaan seperti Instagram, Facebook, Pinterest, dll.
telah dengan antusias mengimplementasikan jaringan saraf untuk memberikan pengalaman terbaik kepada
audiens mereka. Baca: Tutorial Jaringan Syaraf.

Koneksi biologis jaringan saraf convolutional juga akan membantu membuatnya
dasar yang jelas. Pada tahun 1962, Hubel dan Wiesel menunjukkan bahwa neuron yang berbeda di
korteks visual dipecat hanya ketika isyarat visual tertentu hadir. Bersama-sama, ini
neuron memiliki struktur kolumnar dan ketika ditembakkan, secara kolektif menghasilkan visual
persepsi.

Sebagai contoh, beberapa neuron hanya diaktifkan ketika mereka terkena tepi horizontal.
Lainnya menembak di hadapan tepi vertikal atau diagonal. Jadi, neuron yang berbeda
menanggapi komponen visual yang berbeda dan memungkinkan kita untuk melihat.

Apa itu Jaringan Saraf Konvolusi?

Jaringan saraf convolutional— juga disebut CNN atau ConvNet, adalah Pembelajaran Mendalam
algoritma. Dibutuhkan gambar input, memberikan bobot/bias ke komponen
gambar, dan kemudian mengklasifikasikan seluruh gambar. Dengan pelatihan yang cukup, ConvNets adalah
mampu mempelajari filter/klasifikasi dan pra-pemrosesan yang diperlukan lebih rendah karena
dibandingkan dengan algoritma lainnya. Baca tentang perbedaan antara pembelajaran mendalam dan jaringan saraf.

Apa yang pada akhirnya kami inginkan untuk dilakukan oleh jaringan saraf konvolusi adalah membedakan
antara gambar dan mengklasifikasikannya dengan benar. Ia mampu menangkap baik temporal maupun
ketergantungan spasial karena penerapan filter yang relevan.

Dasar-dasar Cara Kerjanya

Gambar menjadi array tergantung pada resolusi dan ukuran gambar.

Setiap entri dalam array akan terdiri dari angka dari 0 hingga 255 (jika sistem RGB adalah
digunakan). Angka ini akan mewakili intensitas piksel pada titik tersebut.

Mengambil semua angka ini sebagai input, komputer akan menampilkan angka. Nomor ini
akan menandakan kemungkinan sebuah gambar milik kelas tertentu (misalnya rumah,
jalan, bus, anjing, kucing, dll.)

Struktur CNN

Melihat gambar di atas, Anda mungkin berpikir ada banyak lapisan dalam konvolusi
jaringan saraf, tetapi pada kenyataannya, hanya ada 3 yang utama. Ini termasuk:
1. Lapisan konvolusi
2. Lapisan penyatuan
3. Lapisan yang sepenuhnya terhubung
Mari selami lebih dalam masing-masing dari ini.

Lapisan konvolusi

Ini adalah lapisan inti dari jaringan saraf convolutional. Parameternya adalah
terdiri dari satu set filter. Filter ini kecil, tetapi menutupi seluruh kedalaman
volume masukan.

Tugas utama yang dilakukan pada lapisan konvolusi adalah ekstraksi level tinggi
fitur. Yang pertama (seperti yang ditunjukkan pada gambar di atas) bertanggung jawab untuk mengekstraksi rendah
fitur level seperti warna, tepi, dll. Lapisan konvolusi berikutnya menghilangkan
fitur tingkat tinggi, dengan demikian, mengarah pada pemahaman/penelitian yang lengkap tentang gambar.

Lapisan Pooling

Lapisan ini dimaksudkan untuk mengurangi ukuran spasial dari representasi gambar. Dengan demikian, itu
juga membantu mengurangi jumlah komputasi dan pemrosesan dalam jaringan saraf.
Selain itu, ia juga mengekstrak fitur dominan yang secara posisi dan rotasi
invarian.

Salah satu jenis pooling dilakukan dengan menggunakan operasi Max. Operasi ini memilih
nilai maksimum dari setiap cluster neuron pada lapisan sebelumnya. Jenis penyatuan lainnya
adalah Average pooling yang mengembalikan nilai rata-rata dari cluster.
Karena Max pooling juga bertindak sebagai penekan kebisingan, kinerjanya lebih baik daripada Rata-rata
pengumpulan.

Seperti yang digambarkan pada gambar di atas, ada beberapa lapisan penyatuan selain
lapisan konvolusi. Semakin banyak jumlah lapisan ini, semakin banyak fitur tingkat rendah
akan diekstraksi. Namun, daya komputasi yang dikeluarkan juga akan meningkat.

Sekarang gambar telah melewati semua konvolusi dan penyatuan saat ini
lapisan, ekstraksi fitur selesai. Sekarang saatnya untuk klasifikasi gambar. Lapisan yang Terhubung Sepenuhnya melakukan tugas ini.

Lapisan Terhubung Sepenuhnya (FCL)

Sebagai lapisan terakhir, lapisan FC hanyalah jaringan saraf umpan-maju. Masukan ke
lapisan yang terhubung sepenuhnya adalah output yang diratakan dari penyatuan/konvolusi terakhir
lapisan. Meratakan berarti matriks atau larik 3 dimensi dibuka gulungannya menjadi sebuah vektor.

Untuk setiap lapisan FC, perhitungan matematis tertentu terjadi. Setelah vektor melewati semua lapisan yang terhubung penuh, fungsi aktivasi softmax digunakan di lapisan terakhir. Ini digunakan untuk menghitung probabilitas input milik tugas tertentu.

Dengan demikian, hasil akhirnya adalah probabilitas yang berbeda dari gambar input milik kelas yang berbeda.

Proses ini diulang untuk berbagai jenis gambar dan gambar individu dalam jenis tersebut. Ini melatih jaringan dan mengajarkannya untuk membedakan antara anjing dan kucing, serta mawar dan bunga matahari.

Bawa pulang

Teknologi yang mendasari jaringan saraf convolutional terus disempurnakan. Jaringan sangat terlatih untuk menghasilkan probabilitas yang akurat. Dapat dikatakan dengan tepat: di bidang visi komputer, CNN mengeja sebuah revolusi saja.

Anda dapat memeriksa Diploma PG kami dalam Pembelajaran Mesin dan AI , yang menyediakan lokakarya praktik langsung, mentor industri tatap muka, 12 studi kasus dan tugas, status Alumni IIIT-B, dan banyak lagi.

Pimpin Revolusi Teknologi Berbasis AI

DIPLOMA PG DALAM PEMBELAJARAN MESIN DAN KECERDASAN BUATAN
Belajarlah lagi