Aljabar Linier untuk Pembelajaran Mesin: Konsep Kritis, Mengapa Belajar Sebelum ML

Diterbitkan: 2020-04-30

Pembelajaran mesin, robotika, ilmu data, kecerdasan buatan, dan visi komputer adalah beberapa di antara bidang-bidang yang telah berperan penting dalam membawa teknologi kita ke level saat ini. Saat Anda mulai memperoleh lebih banyak pengetahuan tentang teknologi ini, Anda akan menemukan serangkaian jargon atau kata-kata spesifik yang umum untuk teknologi ini.

Beberapa istilah ini termasuk regresi laso, kondisi KKT, kernel PCA, mesin vektor dukungan (SVM), pengganda Lagrange, dan regresi ridge, antara lain. Sekarang, jargon-jargon ini mungkin diciptakan hanya untuk menjauhkan orang luar, tetapi mereka mengatakan banyak tentang hubungan mereka dengan aljabar linier khas yang kita ketahui dari hari-hari kita di sekolah.

Jadi, menjadi penting bagi setiap individu yang mempelajari pembelajaran mesin atau ilmu data untuk terlebih dahulu memahami apa itu aljabar linier dan teori optimasi. Anda juga perlu mempelajari ilmu data dan mengetahui cara menggunakannya saat memecahkan masalah menggunakan ML atau saat lebih memahami data besar yang tersedia menggunakan ilmu data.

Di blog ini, kami akan fokus pada bagaimana pembelajaran mesin dan aljabar linier terkait dan bagaimana pemahaman yang lebih baik tentang yang terakhir dapat membantu Anda menguasai yang pertama.

Ada konsep dalam pembelajaran mesin, seperti SVM dan regresi yang tidak akan dapat Anda pahami dengan baik jika Anda tidak mengetahui koneksi aljabar liniernya. Anda dapat pergi tanpa masuk jauh ke dalam aljabar linier dan bagaimana hal itu terkait dengan pembelajaran mesin jika Anda hanya menjalankan konsep-konsep ini untuk mengetahui apa sebenarnya ini dan tidak memiliki keinginan untuk melanjutkan studi mereka lebih jauh.

Namun, jika Anda berencana untuk menjadi insinyur pembelajaran mesin yang akan melatih mesin di masa depan atau melakukan penelitian dan memberikan kontribusi yang signifikan di lapangan, Anda harus menggali lebih dalam. Tidak ada alternatif lain. Memiliki latar belakang yang kuat dalam aljabar linier adalah suatu keharusan. Tujuan utama kami menulis blog ini adalah untuk memberikan dasar-dasar aljabar linier kepada Anda, memastikan bahwa kami menyajikan bagaimana mereka digunakan dalam pembelajaran mesin. Mari kita mulai dengan memahami apa sebenarnya aljabar linier itu.

Daftar isi

Apa itu Aljabar Linier?

Dengan kata sederhana, ini adalah cabang matematika yang menemukan aplikasi signifikan dalam teknik dan sains. Meskipun sangat penting dan memiliki aplikasi yang jauh melampaui imajinasi kita, kita melihat para ilmuwan kita tertinggal dalam hal memiliki pemahaman yang lebih dalam tentangnya. Alasan utama di balik ini adalah karena bukan matematika diskrit yang sering kita temukan digunakan oleh sebagian besar ilmuwan.

Itu milik bagian matematika yang berkelanjutan, yang membuatnya kurang menarik bagi para ilmuwan dan orang-orang yang bekerja di domain teknologi. Sekarang mari kita perjelas satu hal. Jika Anda bahkan tidak memiliki pemahaman dasar tentang cara kerja aljabar linier, Anda akan merasa sangat sulit untuk mempelajari dan menggunakan beberapa algoritme pembelajaran mesin, termasuk yang dalam pembelajaran.

Ketika Anda selesai dengan cara kerja pembelajaran mesin secara fundamental dan bagaimana dan di mana Anda dapat menggunakan algoritmenya, Anda kemudian akan diminta untuk memberikan sedikit lebih banyak waktu untuk belajar matematika. Ini akan membantu Anda memahami banyak hal baru tentang algoritme pembelajaran mesin yang sebelumnya tidak Anda pahami. Anda akan tahu banyak tentang keterbatasan mereka, asumsi yang mendasari, dan yang lainnya.

Sekarang Anda akan menemukan berbagai bidang dalam matematika yang Anda pelajari saat ini untuk belajar berbuat lebih banyak dengan pembelajaran mesin. Anda dapat mempelajari geometri, aljabar, kalkulus, dan statistik di antara topik lainnya; namun, Anda harus bijaksana di sini dan memilih area yang menurut Anda benar-benar akan membantu Anda memperkaya pengalaman dan memberi Anda pijakan yang lebih kokoh saat Anda maju dalam karir pembelajaran mesin Anda. Anda bahkan dapat meminta para ahli untuk membantu Anda membuat keputusan.

Pertanyaan berikutnya yang akan Anda tanyakan pada diri Anda sekarang adalah bagaimana Anda harus menjalani proses pembelajaran ini. Anda tidak dapat mempelajari aljabar linier dari awal. Anda harus memilih dan memilih topik yang digunakan dalam pembelajaran mesin dengan satu atau lain cara. Pada bagian berikutnya, kita akan membahas beberapa topik aljabar linier yang dapat Anda pilih untuk dipelajari.

Ketahui lebih lanjut: 5 Model Pembelajaran Mesin Teratas Dijelaskan Untuk Pemula

Konsep Aljabar Linier Penting

Sangat penting untuk memiliki pengetahuan yang cukup tentang beberapa konsep aljabar linier jika Anda ingin memahami konsep yang mendasari di balik pembelajaran mesin. Jika Anda tidak tahu matematika di balik algoritme pembelajaran mesin canggih ini, Anda tidak boleh ingin menguasainya. Berikut adalah beberapa konsep aljabar linier yang perlu Anda pelajari untuk mengetahui cara kerja pembelajaran mesin.

1. Vektor dan Matriks

Tidak salah untuk mengatakan bahwa kedua konsep ini bisa dibilang dua yang paling penting yang perlu Anda pelajari mengingat kedekatan mereka dengan pembelajaran mesin. Vektor terdiri dari array angka sedangkan matriks terdiri dari vektor 2-D yang biasanya disebutkan dalam huruf besar.

Sekarang mari kita lihat bagaimana mereka terkait dengan algoritme pembelajaran mesin. Vektor menemukan dirinya berguna dalam algoritma pembelajaran mesin yang diawasi di mana mereka hadir dalam bentuk variabel target. Di sisi lain, fitur yang tersedia dalam data membentuk matriks. Anda dapat melakukan sejumlah operasi menggunakan matriks – konjugasi, perkalian, peringkat, transformasi, dan lainnya. Dua vektor yang memiliki jumlah elemen dan persamaan bentuk yang sama juga dapat digunakan untuk melakukan pengurangan dan penambahan.

2. Matriks Simetris

Matriks simetris memegang peranan penting dalam aljabar linier dan pembelajaran mesin. Matriks aljabar linier sebagian besar digunakan untuk membawa fungsi. Sebagian besar waktu, fungsi-fungsi ini simetris, dan begitu juga matriks yang sesuai dengannya. Fungsi-fungsi ini dan nilai-nilai yang dimilikinya dapat digunakan untuk mengukur jarak fitur. Mereka juga dapat digunakan untuk mengukur kovarians fitur. Di bawah ini adalah beberapa sifat matriks simetris:

  • Matriks simetris dan inversnya sama-sama simetris.
  • Semua nilai dalam nilai eigen adalah bilangan real. Tidak ada bilangan kompleks yang ada.
  • Matriks simetris terbentuk ketika matriks dikalikan dengan transposnya.
  • Matriks simetris juga memiliki sifat faktorisasi.
  • Untuk matriks yang memiliki kolom bebas linier, hasil perkalian matriks dengan transposnya adalah dapat dibalik.

3. Nilai Eigen dan Vektor Eigen

Vektor eigen adalah vektor yang hanya berubah oleh faktor skalar, dan arahnya tidak berubah sama sekali. Nilai eigen yang sesuai dengan vektor eigen adalah besaran skalanya. Nilai eigen dan vektor eigen ditemukan dalam dasar-dasar matematika dan komputasi. Ketika kita memplot sebuah vektor pada grafik XY, ​​ia mengikuti arah tertentu. Ketika kita menerapkan transformasi linier pada beberapa vektor, kita melihat bahwa mereka tidak mengubah arahnya. Vektor ini sangat penting dalam pembelajaran mesin.

Nilai eigen dan vektor eigen digunakan untuk meminimalkan noise data. Kami juga dapat menggunakan keduanya untuk meningkatkan efisiensi tugas yang diketahui membutuhkan komputasi intensif. Mereka juga dapat digunakan untuk menghilangkan overfitting. Ada beberapa skenario lain juga di mana nilai eigen dan vektor eigen terbukti berguna.

Cukup sulit untuk memvisualisasikan fitur data suara, tekstual, atau gambar. Data ini biasanya direpresentasikan dalam 3-D. Di sinilah nilai eigen dan vektor eigen muncul. Mereka dapat digunakan untuk menangkap semua jumlah besar yang disimpan dalam matriks. Nilai eigen dan vektor eigen juga digunakan dalam pengenalan wajah.

Baca: Ide Proyek Pembelajaran Mesin untuk Pemula

4. Analisis Komponen Utama (PCA)

Ada banyak waktu ketika dimensi membuat segalanya menjadi sulit ketika harus memecahkan masalah pembelajaran mesin tertentu. Dalam masalah ini, kita berhadapan dengan data yang fitur-fiturnya memiliki korelasi yang sangat tinggi di antara mereka sendiri dan berada dalam dimensi yang lebih tinggi dari biasanya.

Masalah yang muncul dengan masalah dimensi ini adalah menjadi sangat sulit untuk memahami pengaruh yang dimiliki setiap fitur pada variabel target. Hal ini terjadi karena fitur dengan korelasi yang lebih tinggi dari biasanya cenderung mempengaruhi target dengan cara yang sama. Juga sangat sulit untuk memvisualisasikan data yang berada dalam dimensi yang lebih tinggi.

Analisis komponen utama adalah solusi untuk masalah ini. Ini membantu Anda menurunkan dimensi data Anda ke 2-D atau 3-D. Hal ini dilakukan untuk memastikan bahwa tidak ada informasi yang hilang karena perubahan varians maksimum. Matematika di balik PCA berkaitan dengan ortogonalitas. PCA adalah metode terbaik yang tersedia untuk membuat model tidak terlalu rumit dengan menurunkan jumlah fitur dalam kumpulan data.

Namun, sebaiknya hindari menggunakannya sebagai langkah awal untuk menghilangkan overfitting. Anda harus mulai dengan membatasi jumlah fitur dalam data atau meningkatkan kuantitas data. Anda kemudian harus mencoba menggunakan regularisasi L1 atau L2. Jika tidak ada yang berhasil, baru Anda harus beralih ke PCA.

Baca juga: 9 Perpustakaan Pembelajaran Mesin Terbaik yang Harus Anda Ketahui

Mengapa Anda harus belajar aljabar linier sebelum pembelajaran mesin?

1. Aljabar linier adalah kunci untuk unggul dalam pembelajaran mesin

Tidak dapat disangkal fakta bahwa kalkulus mengalahkan aljabar linier dalam hal matematika tingkat lanjut. Kalkulus integral dan diferensial membantu Anda lebih dari sekadar integrasi, diferensiasi, dan limit, mereka juga berfungsi sebagai pengetahuan dasar yang diperlukan untuk aplikasi, seperti tensor dan vektor.

Mempelajari hal-hal ini akan membantu Anda memiliki pemahaman yang lebih baik tentang persamaan linier dan fungsi linier di antara bidang lainnya. Anda juga akan mengetahui tentang konsep lanjutan, seperti metode Simpleks dan vektor spasial. Jika Anda memerlukan bantuan dengan pemrograman linier, Anda dapat menggunakan metode Simplex. Untuk menjadi lebih baik dalam konsep-konsep ini, mulailah dengan memberikan lebih banyak waktu untuk aljabar linier.

2. Prediksi pembelajaran mesin

Saat Anda mempelajari aljabar linier, Anda meningkatkan kesadaran atau naluri yang memainkan peran penting dalam pembelajaran mesin. Anda sekarang dapat memberikan lebih banyak perspektif. Matriks dan vektor yang Anda pelajari akan membantu Anda memperluas pemikiran Anda dan membuatnya lebih teguh. Kemungkinannya tidak terbatas. Anda dapat mulai melakukan hal-hal yang menurut orang lain di sekitar Anda sangat sulit untuk dipahami. Anda dapat mulai memvisualisasikan dan menyiapkan grafik yang berbeda. Anda dapat mulai menggunakan lebih banyak parameter untuk komponen machine learning yang berbeda.

3. Aljabar linier membantu dalam menciptakan algoritme pembelajaran mesin yang lebih baik

Anda dapat menggunakan pembelajaran aljabar linier Anda untuk membangun algoritme pembelajaran mesin yang diawasi dan tidak diawasi dengan lebih baik. Regresi logistik, regresi linier, pohon keputusan, dan mesin vektor pendukung (SVM) adalah beberapa algoritma pembelajaran terawasi yang dapat Anda buat dari awal dengan bantuan aljabar linier.

Di sisi lain, Anda juga dapat menggunakannya untuk algoritme tanpa pengawasan, termasuk dekomposisi nilai tunggal (SVD), pengelompokan, dan analisis komponen. Aljabar linier akan membantu Anda mengembangkan pemahaman yang lebih mendalam tentang proyek pembelajaran mesin yang sedang Anda kerjakan, dan dengan demikian akan memberi Anda fleksibilitas untuk menyesuaikan parameter yang berbeda. Anda dapat mempelajari lebih lanjut tentang Regresi Linier dalam pembelajaran mesin.

4. Aljabar linier untuk pemrosesan grafik yang lebih baik dalam pembelajaran mesin

Proyek pembelajaran mesin memberi Anda interpretasi grafis yang berbeda untuk dikerjakan – gambar, audio, video, dan deteksi tepi. Algoritme pembelajaran mesin memiliki pengklasifikasi yang melatih bagian dari kumpulan data yang diberikan berdasarkan kategorinya. Tugas lain dari pengklasifikasi adalah menghilangkan kesalahan dari data yang telah dilatih.

Pada tahap inilah aljabar linier masuk untuk membantu menghitung kumpulan data yang kompleks dan besar ini. Ini menggunakan teknik dekomposisi matriks untuk memproses dan menangani data besar untuk proyek yang berbeda. Metode dekomposisi matriks yang paling populer adalah dekomposisi QR dan LU.

5. Aljabar linier untuk meningkatkan pandangan Anda tentang statistik

Statistik sangat penting untuk mengatur dan mengintegrasikan data dalam pembelajaran mesin. Jika Anda ingin memahami konsep statistik dengan cara yang lebih baik, Anda harus terlebih dahulu mengetahui cara kerja aljabar linier. Aljabar linier memiliki metode, operasi, dan notasi yang dapat membantu mengintegrasikan topik statistik tingkat lanjut seperti analisis multivariat ke dalam proyek Anda.

Misalkan Anda sedang mengerjakan data pasien yang mencakup berat badan, tinggi badan, tekanan darah, dan detak jantung. Ini adalah beberapa variabel dari kumpulan data yang sedang Anda kerjakan. Mari kita membuat asumsi di sini bahwa peningkatan berat badan akan menyebabkan peningkatan tekanan darah. Tidak terlalu sulit untuk memahami bahwa ini adalah hubungan linier. Jadi untuk lebih memahami bagaimana peningkatan satu variabel mempengaruhi yang lain, Anda perlu memiliki pemahaman yang baik tentang aljabar linier.

Kesimpulan

Pembelajaran mesin itu sendiri adalah topik yang cukup luas; namun, ada konsep lain, seperti aljabar linier, yang sama pentingnya untuk dipelajari seperti ML itu sendiri. Mempelajari aljabar linier dan topik serupa lainnya akan membantu memahami konsep pembelajaran mesin dengan lebih baik.

Jika Anda tertarik untuk mempelajari lebih lanjut tentang pembelajaran mesin, lihat PG Diploma IIIT-B & upGrad dalam Pembelajaran Mesin & AI yang dirancang untuk para profesional yang bekerja dan menawarkan 450+ jam pelatihan ketat, 30+ studi kasus & tugas, IIIT- B Status alumni, 5+ proyek batu penjuru praktis & bantuan pekerjaan dengan perusahaan-perusahaan top.

Mana yang lebih penting untuk pembelajaran mesin – kalkulus atau aljabar linier?

Jika Anda berencana untuk membangun karier dalam pembelajaran mesin, Anda pasti sudah tahu bahwa dasar bidang ini terletak jauh di dalam matematika. Pembelajaran mesin matematika terdiri dari 3 bidang utama, kalkulus, aljabar linier, dan statistik. Karena pembelajaran mesin melibatkan banyak vektor dan matriks, aljabar linier merupakan bagian yang paling mendasar. Tapi kemudian kalkulus juga merupakan bagian integral dari ML karena membantu memahami bagaimana mekanisme pembelajaran mesin berfungsi. Jadi kalkulus dan aljabar linier sama pentingnya. Namun, seberapa banyak dari keduanya yang harus Anda gunakan terutama bergantung pada peran dan tanggung jawab pekerjaan Anda.

Apakah aljabar linier lebih sulit dipelajari daripada kalkulus?

Aljabar linier adalah semua tentang mempelajari garis lurus menggunakan persamaan linier, sedangkan kalkulus adalah semua tentang berbagai komponen yang melibatkan turunan, vektor, integral, kurva, dan banyak lagi. Meskipun demikian, aljabar linier jauh lebih mudah dipelajari daripada kalkulus dasar. Dalam aljabar linier, jika Anda dapat memahami teori di balik teorema aljabar linier, Anda dapat menyelesaikan semua pertanyaan terkait. Namun, itu tidak cukup dalam memecahkan masalah kalkulus. Lebih dari sekedar menghafal algoritma, yaitu bagian teori, Anda perlu memahami aspek komputasi untuk menjawab pertanyaan komputasi dalam kalkulus. Kalkulus adalah bagian matematika yang paling menantang, sedangkan aljabar linier lebih konkret dan kurang abstrak; selanjutnya lebih mudah dipahami.

Apakah statistik penting dalam pembelajaran mesin?

Dalam hal pembelajaran mesin, Anda tidak dapat mengabaikan statistik. Para ahli berpendapat bahwa pembelajaran mesin adalah statistik terapan, sehingga merupakan prasyarat bagi mereka yang ingin berkarir di bidang pembelajaran mesin. Dalam merancang model pembelajaran mesin, data memainkan peran penting yang fundamental. Teknik statistik diperlukan untuk menemukan jawaban berdasarkan akumulasi data yang akan digunakan untuk melatih model pembelajaran mesin yang berbeda. Jadi, pemahaman dasar tentang statistik adalah wajib untuk pembelajaran mesin.