Regresi Isotonik dalam Pembelajaran Mesin: Memahami Regresi dalam Pembelajaran Mesin
Diterbitkan: 2020-12-21Ada berbagai jenis model regresi (algoritma) yang digunakan untuk melatih program machine learning, seperti regresi linier, logistik, ridge, dan laso. Dari jumlah tersebut, model regresi linier adalah model regresi yang paling dasar dan paling banyak digunakan. Regresi isotonik dalam pembelajaran mesin didasarkan pada regresi linier. Oleh karena itu, sebelum kita beralih ke regresi isotonik, pertama-tama mari kita lihat regresi linier dalam pembelajaran mesin.
Daftar isi
Memahami Regresi Linier dalam Pembelajaran Mesin
Sumber
Model regresi linier digunakan untuk mengetahui hubungan antara variabel terikat dan variabel bebas. Ini mengasumsikan hubungan linier, diwakili oleh garis yang paling cocok, antara dua variabel. Persamaan y= mx + c + e digunakan untuk menyatakan model regresi linier dimana:
m = kemiringan garis
c = mencegat
e = kesalahan dalam model

Model regresi linier rentan terhadap outlier, sangat tidak fleksibel, dan karenanya tidak dapat digunakan untuk data berukuran besar. Ketika model ini digunakan pada data uji ukuran besar, ada beberapa contoh yang terletak di luar kemiringan garis, yang juga disebut kesalahan residual. Metode seperti regularisasi L1 dan L2 dapat digunakan untuk mengurangi kecuraman kemiringan garis, tetapi metode tersebut tidak terbukti berguna.
Harus Dibaca: Model Pembelajaran Mesin Dijelaskan
Ini membatasi keakuratan algoritme pembelajaran mesin. Pendekatan baru regresi isotonik dalam pembelajaran mesin sedang diadopsi untuk mengatasi batas ini. Meskipun saat ini tidak tersebar luas, pendekatan ini sangat ampuh dan dapat membantu meningkatkan akurasi program pembelajaran mesin.
Memahami Regresi Isotonik dalam Pembelajaran Mesin
Sebelum menyelami hal-hal teknis, mari kita pahami regresi isotonik dalam pembelajaran mesin dalam istilah awam.
Mari kita mulai dengan memecahkan kode kata 'isotonik.' Kata 'isotonik' memiliki akar kata Yunani asal, terbuat dari dua bagian, 'iso' dan 'tonik.' Di sini, 'iso' berarti sama dan 'tonik' berarti peregangan. Dalam hal algoritma pembelajaran mesin, regresi isotonik dapat, oleh karena itu, dipahami sebagai peregangan yang sama di sepanjang garis regresi linier. Ia bekerja di atas model regresi linier.
Mari kita lihat berbagai aspek yang terkait dengan regresi isotonik yang akan membantu kita memahaminya dengan lebih baik.
1. Model Linear Sepotong
Seperti disebutkan sebelumnya, kecuraman kemiringan garis regresi linier perlu diminimalkan, yang digunakan metode regularisasi L1 dan L2. Pendekatan regresi isotonik berbeda sama sekali dengan membagi grafik menjadi bagian-bagian dengan membuat ambang batas dan memiliki garis linier untuk setiap bagian yang terhubung ujung ke ujung.
Misalnya, pada gambar di atas, sumbu X dapat dibagi lagi menjadi berbagai bagian yang lebih kecil, katakanlah dalam interval yang sama 10. Setiap interval ini dapat disebut sebagai bin, seperti bin1, bin2, bin3, bin4, dan seterusnya. di. Persamaan linear, oleh karena itu, sekarang menjadi,
y= m1x1 + m2x2 + m3x3 +….. mnxn + c, dimana:
m1, m2, m3….mn = kemiringan garis untuk masing-masing tempat sampah.
Ini membantu meminimalkan kesalahan dan mengurangi kemiringan garis yang paling sesuai.
2. Kemiringan Non-negatif
Karena fungsi isotonik adalah fungsi monoton, kemiringan solusi selalu non-negatif. Penurunan kemiringan tidak diperbolehkan saat berpindah dari satu ambang batas ke ambang lainnya. Titik terendah di ambang batas harus selalu lebih besar dari titik tertinggi di ambang batas sebelumnya.
Misalnya, misalkan x1, x2, x3, x4…xn adalah nilai dari titik data yang dipertimbangkan untuk kemiringan dalam bin b1, b2, b3, b4…bn. Kemudian, sesuai aturan, kemiringannya harus non-negatif. Karenanya,

f(x1) <= f(x2) <= f(x3) <= f(x4)…<= f(xn).
Jadi, kita mulai dengan titik yang lebih rendah (di mana f(x1) adalah titik terendah) dan secara bertahap pindah ke titik yang lebih tinggi dengan setiap ambang batas. Kemiringan ambang batas bisa nol (garis horizontal) tetapi tidak pernah bisa negatif (kemiringan ke bawah).
Baca: Ide Proyek Pembelajaran Mesin untuk Pemula
Keuntungan Menggunakan Regresi Isotonik dalam Model Pembelajaran Mesin
Menggunakan regresi isotonik menawarkan dua manfaat utama, yang dibahas di bawah ini.
1. Penskalaan Multidimensi
Regresi isotonik sangat membantu jika Anda memiliki banyak variabel input. Kita dapat memeriksa setiap dimensi karena setiap fungsi dan menginterpolasinya secara linier. Ini memungkinkan penskalaan multidimensi yang mudah.
2. Kalibrasi Nilai Probabilitas
Dalam regresi logistik, misalkan kita memiliki variabel x, dan kita menyatakan probabilitas p(1) di mana nilai probabilitas untuk variabel tidak meningkat. Namun, pada kenyataannya, nilai probabilitasnya lebih tinggi di dunia nyata. Dalam kasus tersebut, untuk tujuan kalibrasi atau meningkatkan kemungkinan variabel tersebut, regresi isotonik terbukti sangat membantu.
Lihat: Pertanyaan Wawancara Pembelajaran Mesin

Kekurangan Menggunakan Regresi Isotonik dalam Model Pembelajaran Mesin
Ada satu kelemahan utama menggunakan regresi isotonik, yang dibahas di bawah ini.
Risiko overfitting
Ada risiko yang signifikan dari overfitting hyperparameter (K) karena jumlah kendala isotonik dan fitur prediktor meningkat, tetapi metode alur kerja validasi silang dapat digunakan untuk mengelola masalah tersebut.
Kesimpulan
Saat ini, hanya tiga bahasa utama yang memiliki paket sumber terbuka dengan regresi Isotonik. Namun, melihat manfaat menggunakan regresi isotonik dalam masalah pembelajaran mesin , cakupan, penggunaan, dan ketersediaan paket regresi isotonik pasti akan meningkat di masa depan.
Kita dapat melihat regresi isotonik menggantikan metode regresi linier dan normalisasi L1 dan L2. Oleh karena itu, agar siap di masa depan, perlu untuk selalu memperbarui diri dan mengetahui tentang regresi isotonik mulai sekarang!
Jika Anda tertarik untuk mempelajari lebih lanjut tentang regresi isotonik dalam pembelajaran mesin atau konsep terkait pembelajaran mesin lainnya, Anda dapat melihat IIIT-B dan PG Diploma dalam Pembelajaran Mesin dan AI upGrad , yang merupakan program terlaris di India dengan peringkat bintang 4,5 . Kursus ini memiliki 450+ jam pembelajaran, 30+ studi kasus, dan tugas, serta membantu siswa mempelajari keterampilan yang dibutuhkan terkait dengan pembelajaran mesin dan AI.
Mengapa regresi penting dalam pembelajaran mesin?
Analisis regresi, semacam algoritma pembelajaran terawasi, adalah salah satu konsep dasar dalam pembelajaran mesin. Regresi digunakan untuk membangun hubungan antara variabel yang berbeda dengan mencoba memperkirakan bagaimana nilai satu mempengaruhi yang lain. Di bidang pembelajaran mesin, regresi terdiri dari algoritme matematika kompleks yang membantu memperkirakan hasil dari variabel target tertentu berdasarkan nilai yang terus berubah dari satu atau beberapa variabel prediktor. Jenis analisis regresi yang paling populer adalah regresi linier karena sangat mudah digunakan untuk membuat prakiraan dan prediksi.
Apakah pembelajaran mesin sama dengan ilmu data?
Dengan kata kunci seperti ilmu data dan pembelajaran mesin menjadi arus utama saat ini, banyak orang sering merasa bingung tentang apa yang sebenarnya mereka maksud. Mari kita coba jelaskan di sini dengan cepat. Ilmu data mengacu pada studi volume besar data yang dihasilkan oleh organisasi. Ilmuwan data menggunakan berbagai teknik untuk mengungkapkan wawasan berharga dari data ini sehingga bisnis dapat memperoleh manfaat maksimal dan tetap menjadi yang terdepan dalam persaingan. Pembelajaran mesin berbeda dari ilmu data; itu menggunakan teknik ilmu data untuk belajar tentang data yang kemudian digunakan untuk melatih mesin. Pembelajaran mesin menggunakan model matematika yang kompleks untuk membantu komputer belajar tanpa campur tangan manusia.
Apakah pembelajaran mesin sama dengan pembelajaran mendalam?
Pembelajaran mesin adalah bagian dari kecerdasan buatan. Ini menggunakan algoritma atau model yang dapat menganalisis data, belajar darinya, dan kemudian menerapkan pembelajaran tersebut untuk membantu komputer atau mesin membuat keputusan tanpa masukan manusia yang eksplisit. Di sisi lain, pembelajaran mendalam adalah subbidang pembelajaran mesin. Ini digunakan untuk menyusun algoritma atau model matematika berlapis-lapis untuk mengembangkan jaringan saraf tiruan yang menyerupai struktur otak manusia. Jaringan saraf ini dapat belajar sendiri dan membuat keputusan cerdas menggunakan kerangka logisnya sendiri dan menganalisis data.