Jaringan Saraf Kapsul: Apa itu, Cara Kerja, Arsitektur & Komponen

Diterbitkan: 2020-04-03

Bagaimana Anda mengenali sesuatu? Jika saya menulis 'Mereka' dan 'Mereka', apakah Anda akan membaca keduanya sebagai 'Mereka'? Jawaban Anda mungkin adalah ya.

Otak Anda dapat mengidentifikasi fitur utama dan membantu Anda mengenali berbagai hal. Itu sebabnya Anda bisa melihat wajah dengan mudah. Jaringan saraf kapsul bekerja dengan cara yang sama. Pada artikel ini, kita akan melihat apa itu dan bagaimana mereka bekerja. Jika Anda tertarik dengan algoritme pembelajaran mesin , Anda pasti akan menyukai artikel ini. Jadi, mari kita mulai.

Daftar isi

Apa itu Jaringan Saraf Kapsul?

Jaringan saraf kapsul berfokus pada replikasi jaringan saraf biologis untuk melakukan pengenalan dan segmentasi yang lebih baik. Mereka adalah jenis Jaringan Syaraf Tiruan. Mereka memiliki lapisan bersarang di bawah satu lapisan jaringan saraf kapsul, itulah yang ditunjukkan oleh kata 'kapsul'.

Kapsul di jaringan ini menentukan parameter fitur objek. Misalkan jaringan kapsul Anda harus mengidentifikasi wajah. Kapsul akan fokus untuk menentukan apakah fitur wajah tertentu ada atau tidak. Mereka tidak terbatas pada ini saja. Mereka juga akan memeriksa bagaimana fitur wajah tertentu diatur. Jadi, sistem Anda dapat mengidentifikasi wajah hanya jika kapsul menentukan bahwa elemen wajah tersebut berada dalam urutan yang benar.

Anda mungkin bertanya-tanya, bagaimana mereka menentukan urutan fitur tersebut? Jaringan ini dapat melakukannya karena masukan yang Anda berikan kepada mereka. Ketika mereka telah memeriksa ratusan (atau bahkan ribuan) gambar, mereka dapat melakukan tugas ini secara efisien.

Pelajari lebih lanjut: Neural Networks: Aplikasi di Dunia Nyata

Bagaimana Cara Kerja Jaringan Kapsul?

Sekarang, mari kita lihat bagaimana jaringan ini beroperasi. Awalnya, kapsul melakukan perkalian matriks dari matriks bobot dengan vektor input. Ini memberi kita informasi tentang hubungan spasial antara beberapa fitur tingkat rendah dan tingkat tinggi.

Setelah itu, kapsul pilih kapsul induk. Mereka membuat pemilihan melalui perutean dinamis, yang akan kita bahas nanti di artikel ini. Setelah mereka memilih kapsul induknya, mereka menemukan jumlah vektor terjepit antara 0 dan 1 ketika mereka berpegang pada arahnya. Anda melakukan squashing melalui menggunakan norma kerangka koordinat sebagai probabilitas keberadaan dan jarak cosinus sebagai ukuran kesepakatan.

Ada perbedaan yang signifikan antara jaringan saraf standar dan jaringan saraf kapsul. Sementara jaringan kapsul menggunakan kapsul untuk merangkum bit informasi penting tentang gambar, jaringan saraf standar menggunakan neuron untuk tujuan ini. Kapsul menghasilkan vektor, sedangkan neuron hanya dapat menghasilkan besaran skalar. Karena alasan ini, kapsul dapat mengidentifikasi arah wajah (atau fitur tertentu), tetapi neuron tidak bisa. Jika Anda mengubah arah fitur apa pun, nilai vektor akan tetap sama, tetapi arahnya akan berubah sesuai dengan perubahan posisinya.

Jaringan kapsul berkinerja sangat baik pada kumpulan data kecil, dan membuatnya lebih mudah untuk menafsirkan gambar yang kuat. Selain itu, mereka menyimpan semua informasi gambar, termasuk tekstur, lokasi, dan pose. Satu-satunya kelemahan mereka adalah mereka tidak dapat mengungguli kumpulan data yang besar.

Baca: 6 Jenis Fungsi Aktivasi di Neural Network

Apa Arsitektur Jaringan Saraf Kapsul?

Dua komponen utama dari jaringan kapsul adalah encoder dan decoder. Secara total, mereka mengandung enam lapisan. Encoder memiliki tiga lapisan pertama, dan mereka memiliki tanggung jawab untuk mengambil dan mengubah gambar input menjadi vektor (16-dimensi). Lapisan pertama encoder adalah jaringan saraf convolutional, dan mengekstrak fitur dasar gambar.

Lapisan kedua adalah Jaringan PrimaryCaps, dan dibutuhkan fitur-fitur penting tersebut dan menemukan pola yang lebih rinci di antara mereka. Misalnya, bisa melihat hubungan spasial antara goresan tertentu. Kumpulan data yang berbeda memiliki jumlah kapsul yang berbeda di Jaringan PrimaryCaps; misalnya, dataset MNIST memiliki 32 kapsul. Lapisan ketiga adalah Jaringan DigitCaps, dan jumlah kapsul yang ada di dalamnya juga bervariasi. Setelah lapisan ini, encoder memiliki vektor 16 dimensi yang menuju ke decoder.

Decoder memiliki tiga lapisan yang terhubung. Dibutuhkan vektor 16 dimensi dan mencoba untuk merekonstruksi gambar yang sama dari awal dengan bantuan data yang dimilikinya. Dengan cara ini, jaringan menjadi lebih kuat karena dapat membuat prediksi sesuai dengan pengetahuannya.

Baca juga: Jaringan Saraf Berulang dengan Python

Komputasi di CNN

Perkalian Matriks

Antara lapisan pertama dan lapisan kedua, kami melakukan perkalian matriks. Ini mengkodekan informasi hubungan spasial, dan info yang dikodekan menunjukkan kemungkinan klasifikasi label.

Berat Skalar

Pada tahap perhitungan ini, kapsul tingkat bawah menyesuaikan bobotnya sesuai dengan bobot kapsul tingkat tinggi. Mereka melakukannya agar sesuai dengan bobot kapsul tingkat tinggi. Kapsul tingkat tinggi membuat grafik distribusi berat dan menerima alokasi terbesar untuk dilewati. Mereka semua berkomunikasi satu sama lain melalui perutean dinamis.

Perutean Dinamis

Dalam perutean dinamis, kapsul bawah mengirimkan datanya ke kapsul induk. Mereka semua mengirim data mereka ke kapsul yang paling cocok menurut mereka, dan kapsul yang mendapatkan sebagian besar data menjadi kapsul induk. Kapsul induk mengikuti kesepakatan dan menetapkan bobot yang sesuai.

Untuk memahami perutean dinamis, misalkan Anda memberikan gambar jaringan kapsul sebuah rumah. Ia menghadapi beberapa masalah dengan identifikasi atap rumah. Jadi kapsul menganalisis gambar, khususnya bagian konstannya. Mereka mengkoordinasikan kerangka rumah mengenai dinding dan atap.

Mereka pertama-tama membuat keputusan apakah objek itu adalah rumah atau bukan dan kemudian mengirim prediksi mereka ke kapsul tingkat tinggi. Jika proyeksi atap mengenai dinding cocok dengan prediksi lain dari kapsul tingkat rendah, output mengatakan objek adalah rumah. Ini adalah proses perutean berdasarkan kesepakatan.

Nonlinier vektor-ke-vektor

Setelah perutean dinamis selesai, sistem memencet informasi, yang berarti ia memampatkan informasi itu. Ini memberi Anda kemungkinan apakah kapsul akan mengenali fitur tertentu atau tidak.

Pikiran Akhir

Setelah membaca artikel ini, Anda pasti sudah akrab dengan jaringan saraf kapsul dan operasinya. Anda pasti juga menyadari betapa bermanfaatnya tindakan mereka.

Jika Anda ingin mempelajari lebih lanjut tentang algoritma pembelajaran mesin, lihat blog kami. Anda akan menemukan beberapa artikel berpengetahuan di sana.

Jika Anda tertarik untuk mempelajari lebih lanjut tentang pembelajaran mesin, lihat PG Diploma IIIT-B & upGrad dalam Pembelajaran Mesin & AI yang dirancang untuk para profesional yang bekerja dan menawarkan 450+ jam pelatihan ketat, 30+ studi kasus & tugas, IIIT- B Status alumni, 5+ proyek batu penjuru praktis & bantuan pekerjaan dengan perusahaan-perusahaan top.

Apa itu jaringan saraf transformator?

Ketika jaringan saraf mengambil urutan vektor sebagai input, mengubahnya menjadi vektor yang disebut (proses ini disebut pengkodean) dan kemudian menerjemahkannya kembali ke urutan lain, itu disebut jaringan saraf transformator. Transformator adalah komponen yang ditemukan di banyak arsitektur jaringan saraf untuk memproses data sekuensial, termasuk teks bahasa biasa, sinyal akustik, urutan genom, dan data deret waktu. Aplikasi paling umum dari jaringan saraf trafo adalah dalam pemrosesan bahasa alami.

Apa itu jaringan saraf grafis dan bagaimana cara kerja grafiknya?

Jaringan saraf grafik, atau GNN, adalah model saraf yang menggunakan transmisi pesan antara node grafik untuk mewakili ketergantungan grafik. Jaringan ini langsung beroperasi pada struktur grafik yang diberikan. Dengan kata sederhana, setiap node dalam grafik memiliki label, dan jaringan saraf digunakan untuk memprediksi node label berdasarkan kebenaran dasar. GNN baru-baru ini menjadi terkenal dalam berbagai disiplin ilmu, termasuk jejaring sosial, grafik pengetahuan, sistem pemberi rekomendasi, dan bahkan ilmu kehidupan.

Apakah kapsul berbeda dari jaringan kapsul?

Kedua istilah, kapsul dan jaringan kapsul, terhubung ke pembelajaran mendalam, tetapi keduanya bukan hal yang sama. Sekelompok neuron yang vektor aktivitasnya mewakili parameter instantiasi item tertentu, seperti objek yang dikenal sebagai kapsul. Namun, jaringan kapsul adalah jaringan yang dapat mengambil informasi geografis dan aspek penting lainnya untuk meminimalkan kehilangan data selama proses operasi penyatuan.