Jenis Model Pembelajaran Mendalam Teratas yang Harus Dipelajari oleh Insinyur AI pada tahun 2022

Diterbitkan: 2021-01-01

Daftar isi

pengantar

Deep Learning adalah teknik pembelajaran mesin yang memanfaatkan berbagai lapisan pemrosesan informasi non-linier untuk transformasi tanpa pengawasan dan terawasi, ekstraksi fitur, klasifikasi, dan analisis pola.

Ketika datang ke pemrosesan informasi secara non-linear, itu terdiri dari lapisan hierarkis yang berbeda. Di sini, beberapa konsep tingkat rendah mampu mendefinisikan konsep tingkat tinggi. Pembelajaran terawasi adalah bentuk pembelajaran mesin set pelatihan, dan satu set contoh disampaikan sebagai input dalam sistem selama fase pelatihan.

Karena setiap input diberi label dengan nilai output, sistem mengetahui output ketika satu set input diberikan. Di sisi lain, dalam pembelajaran tanpa pengawasan, input tidak diberi label dengan kelas tempatnya berada. Oleh karena itu, terserah pada sistem untuk mengembangkan dan mengatur data dengan mencari karakteristik umum dan membuat perubahan yang diperlukan berdasarkan pengetahuan internal.

Jaringan saraf tiruan dangkal. Dengan demikian, mereka tidak dapat menangani data kompleks seperti yang ditemukan dalam aplikasi sehari-hari seperti gambar, ucapan alami, pengambilan informasi, dan aplikasi pemrosesan informasi seperti manusia. Untuk jenis aplikasi ini, model pembelajaran mendalam sangat cocok. Dengan bantuan pembelajaran mendalam, dimungkinkan untuk mengklasifikasikan, mengenali, dan mengkategorikan pola data untuk mesin dengan sedikit usaha.

Artikel Terkait: Teknik Pembelajaran Mendalam Teratas

Jenis Model Pembelajaran Mendalam

Model pembelajaran mendalam telah berkembang, dan sebagian besar didasarkan pada jaringan saraf tiruan. Yang paling signifikan di antara mereka adalah jaringan saraf convolutional (CNNs). Ini juga termasuk variabel laten dan formula proposisional yang diatur secara berlapis dalam model generatif yang dalam.

Autoencoder

Ini adalah jaringan saraf tiruan, yang dapat belajar dari pola pengkodean yang berbeda. Autoencoder mirip dengan perceptron multilayer yang memiliki lapisan input, lapisan tersembunyi, atau lapisan output dalam bentuk yang paling sederhana. Lapisan keluaran memiliki jumlah node yang sama dengan lapisan keluaran. Itu tidak memprediksi nilai target berdasarkan vektor keluaran; sebagai gantinya, Autoencoder dapat memprediksi inputnya. Mekanisme pembelajaran ini dapat diuraikan sebagai berikut:

Untuk setiap masukan x,

Hitung aktivasi dengan membiarkan umpan maju lewat di setiap lapisan tersembunyi dan lapisan keluaran
Manfaatkan fungsi kesalahan yang sesuai untuk mendeteksi penyimpangan di antara nilai yang dihitung
Perbarui bobot dengan menyebarkan kembali kesalahan
Terus ulangi tugas sampai menghasilkan hasil yang memuaskan

Jika lapisan tersembunyi memiliki lebih sedikit node daripada node input-output, maka aktivasi lapisan tersembunyi terakhir dianggap sebagai representasi terkompresi dari input. Jika node lapisan tersembunyi lebih besar jumlahnya, autoencoder akan mempelajari fungsi identitas dan terbukti tidak berguna dalam banyak kasus.

Jaring Keyakinan Dalam

Ini memberikan solusi untuk menangani fungsi tujuan minima lokal dan non-cembung yang memiliki perceptron multilayer yang khas. Anda dapat menganggapnya sebagai jenis pembelajaran mendalam alternatif yang terdiri dari beberapa lapisan variabel laten yang saling berhubungan dengan lapisan lain. Ini adalah versi terbatas dari mesin Boltzmann.

Di sini, lapisan tersembunyi setiap sub jaringan akan berfungsi sebagai lapisan input yang terlihat untuk lapisan jaringan yang berdekatan. Jadi, itu membuat lapisan terlihat terendah menjadi set pelatihan untuk lapisan jaringan yang berdekatan. Oleh karena itu, setiap lapisan jaringan dapat dilatih dengan rakus dan mandiri. Setiap lapisan struktur dalam menggunakan variabel tersembunyi sebagai variabel yang diamati untuk melatih setiap lapisan struktur dalam. Algoritma untuk melatih jaringan kepercayaan yang mendalam adalah sebagai berikut:

Mempertimbangkan vektor input
Gunakan vektor input untuk melatih mesin Boltzmann dan dapatkan matriks bobot
Gunakan matriks bobot untuk melatih dua lapisan bawah jaringan
Gunakan RBM jaringan untuk menghasilkan vektor input baru melalui aktivasi rata-rata dan pengambilan sampel unit tersembunyi.
Terus ulangi prosedur ini sampai Anda mencapai dua lapisan teratas jaringan.

Baca Juga: Deep Learning vs Neural Networks

Jaringan Saraf Konvolusi (CNN)

Ini adalah varian lain dari perceptron multilayer berdasarkan feedforward. Ini mengatur neuron individu sedemikian rupa sehingga mereka merespons semua daerah yang tumpang tindih di area visual. Ini adalah salah satu algoritma pembelajaran mendalam yang mampu mengambil gambar input dan menetapkan pentingnya bias dan bobot yang dapat dipelajari dari berbagai aspek/objek dalam gambar.

Itu bisa membedakan satu dari yang lain. Kebutuhan pre-processing pada CNN cukup rendah jika dibandingkan dengan algoritma klasifikasi lainnya. CNN memiliki kemampuan untuk mempelajari karakteristik dan filter ini.

CNN adalah salah satu kategori utama sebagai berikut:

Deteksi objek

Klasifikasi gambar

Pengenalan gambar

Pengenalan wajah dll.

Ini adalah beberapa dari beberapa area di mana CNN dapat digunakan secara luas.

Untuk klasifikasi citra, CNN akan menerima citra masukan, memprosesnya, dan melakukan klasifikasi dalam kategori yang berbeda. Komputer memvisualisasikan gambar input sebagai array piksel, dan itu adalah variabel resolusi gambar. Secara teknis, model CNN akan memasukkan setiap gambar input melalui beberapa lapisan konvolusi dengan filter untuk pelatihan dan pengujian.

Lapisan pertama dikenal sebagai Convolution, yang ditugaskan untuk mengekstrak fitur dari gambar input. Konvolusi dapat menjaga hubungan antar piksel karena dapat mempelajari fitur gambar melalui penggunaan kotak kecil data masukan. Ini mengeksekusi operasi matematika dengan mengambil dua input: matriks gambar dan filter atau kernel.

Ketika konvolusi gambar dilengkapi dengan filter yang berbeda, ia akan mampu melakukan operasi seperti deteksi tepi, penajaman, dan pengaburan melalui filter.

Dalam beberapa tahun terakhir, bidang visi komputer telah menyaksikan kemajuan yang cukup besar. Salah satu kemajuan terbesar adalah CNN. Deep CNNs telah berkembang menjadi aplikasi visi komputer yang paling disukai yang digunakan dalam pengenalan gerakan, mobil yang dapat mengemudi sendiri, penandaan otomatis teman dalam gambar yang diposting ke Facebook, fitur keamanan wajah, dan pengenalan plat nomor otomatis.

Jaringan Saraf Berulang

Ini adalah jenis jaringan saraf di mana output langkah sebelumnya dapat diumpankan sebagai input ke langkah saat ini. Input dan output dalam jaringan saraf konvensional tidak tergantung satu sama lain. Namun, dalam kasus di mana ada kebutuhan untuk memprediksi kata-kata yang berurutan dalam sebuah kalimat, akan ada kebutuhan untuk mengingat kata-kata sebelumnya.

Munculnya RNN menjanjikan untuk menyelesaikan masalah ini dengan bantuan lapisan tersembunyi. Salah satu fitur utama RNN adalah Hidden State yang mampu mengingat beberapa informasi secara berurutan.

RNN dilengkapi dengan memori yang dapat mengingat semua informasi tentang perhitungan. Itu dapat menggunakan parameter yang sama untuk setiap input untuk melakukan tugas yang sama pada semua input atau lapisan tersembunyi untuk menghasilkan output yang diinginkan. Ini akan sangat mengurangi kompleksitas parameter, yang sangat kontras dengan jaringan saraf lainnya.

Pikiran Akhir

Perhitungan gradien tidak hanya bergantung pada langkah saat ini tetapi juga pada langkah sebelumnya. Ada varian yang disebut jaringan saraf berulang dua arah yang digunakan oleh beberapa aplikasi. Di sini, jaringan mempertimbangkan keluaran sebelumnya dan yang diharapkan di masa depan. Dengan memperkenalkan beberapa lapisan tersembunyi, pembelajaran mendalam dapat dicapai dalam jaringan saraf berulang langsung dua arah.

Jika Anda tertarik untuk mempelajari lebih lanjut tentang teknik pembelajaran mendalam , pembelajaran mesin, lihat Sertifikasi PG IIIT-B & upGrad dalam Pembelajaran Mesin & Pembelajaran Mendalam yang dirancang untuk profesional yang bekerja dan menawarkan 240+ jam pelatihan ketat, 5+ studi kasus & penugasan, status Alumni IIIT-B & bantuan pekerjaan dengan perusahaan papan atas.

Pimpin Revolusi Teknologi Berbasis AI

DIPLOMA PG DALAM PEMBELAJARAN MESIN DAN KECERDASAN BUATAN

Belajarlah lagi