Implementasi Regresi Linier dengan Python: Panduan Lengkap
Diterbitkan: 2019-11-18Baik Anda mempelajari pembelajaran mesin atau statistik dengan Python, Anda akan menemukan regresi linier. Regresi linier adalah salah satu bagian penting dari kursus sertifikasi pembelajaran mesin.
Apa itu? Bagaimana Anda melakukan regresi linier dengan Python?
Dalam artikel ini, kita akan menemukan jawaban atas pertanyaan-pertanyaan ini. Setelah membaca artikel ini, Anda akan terbiasa dengan:
- Regresi dan apa itu?
- Apa itu regresi linier?
- Cara melatih model regresi linier
- Aplikasi regresi linier
Mari kita mulai.
Daftar isi
Apa itu Regresi?
Analisis regresi mengacu pada proses statistik spesifik yang Anda gunakan untuk memperkirakan hubungan antara variabel dependen dan independen.
Ini populer di berbagai industri, seperti keuangan dan perbankan. Dengan menggunakan analisis regresi, Anda dapat memahami hubungan antara dua variabel dalam lingkungan tertentu.

Misalkan Anda ingin mencari harga rumah di suatu daerah tertentu. Untuk itu, Anda perlu mengamati kota wilayah tersebut, jumlah penduduk, ketersediaan fasilitas, dan banyak hal lainnya.
Hal-hal di mana harga rumah akan bergantung disebut fitur . Dan masalah di mana faktor-faktor yang terkait dengan biaya setiap rumah adalah pengamatan. Dalam contoh ini, asumsinya adalah bahwa lokasi, fasilitas, dan faktor lain memengaruhi harga setiap rumah.
Dalam istilah yang lebih sederhana, Anda membuat beberapa pengamatan mengenai subjek tertentu dalam analisis regresi. Pengamatan Anda memiliki beberapa fitur dan beberapa anggapan sebelum Anda mulai membentuk hubungan di antara mereka.
Ada dua macam fitur dalam analisis regresi. Mereka:
- Fitur dependen, yang disebut output dependen, variabel, atau tanggapan
- Fitur independen, yang disebut output independen, variabel, atau tanggapan
Umumnya, masalah regresi memiliki satu variabel dependen kontinu. Inputnya bervariasi.
Anda dapat menunjukkan output dengan y dan input dengan x. Tidak ada aturan keras dan cepat untuk itu, tetapi itu adalah praktik umum untuk menggunakan y dan x untuk menunjukkan keluaran dan masukan ini.
Jika Anda memiliki beberapa variabel independen, Anda dapat mewakili sebagai x = (x1,…,xr), di mana r menunjukkan jumlah input.
Dapatkan Kursus Pembelajaran Mesin Terbaik online dari Universitas top dunia – Magister, Program Pascasarjana Eksekutif, dan Program Sertifikat Tingkat Lanjut di ML & AI untuk mempercepat karier Anda.
Apa itu Regresi Linier?
Regresi linier adalah jenis regresi yang paling populer. Ini adalah metode statistik untuk memodelkan hubungan antara output dependen dan sekelompok output independen.
Dalam artikel ini, kami akan menyebut keluaran independen 'fitur' dan keluaran dependen 'respons'.
Jika regresi linier hanya memiliki satu ciri, maka disebut regresi linier univariat. Demikian pula, jika memiliki banyak fitur, Anda akan menyebutnya Regresi linier berganda.
Keuntungan yang paling menonjol dari regresi linier adalah kemudahan menginterpretasikan hasilnya. Pertanyaan Wawancara Regresi Linier
Ini adalah bentuk paling sederhana dari regresi.
Hipotesa
Jika y adalah nilai prediksi, 0 adalah suku bias, xn dan merupakan nilai fitur, dan Anda akan merepresentasikan model regresi linier dengan persamaan berikut:
Y = 0 + 1 x 1 + 2 x 2 +…. + n x n
Di sini n menunjukkan parameter model.
Kode Python Regresi Linier
Untuk membuat model regresi linier, Anda juga memerlukan kumpulan data untuk memulai. Ada beberapa cara Anda dapat menggunakan kode Python untuk regresi linier.
Kami menyarankan untuk mempelajari Python dan membiasakan diri dengan pustaka python sebelum Anda mulai bekerja dalam hal ini.
Ini dapat membantu Anda membuat model regresi linier dasar.
Melatih Model Regresi
Anda harus menemukan parameter yang diperlukan untuk model, sehingga paling cocok dengan data. Anda harus menemukan garis yang paling cocok (atau garis regresi).
Garis regresi adalah garis di mana kesalahan antara angka yang diamati dan angka yang diprediksi adalah minimum. Nama lain untuk kesalahan ini adalah residual.
Untuk mengukur kesalahan, Anda harus mendefinisikan fungsi biaya:

J ( ) = 1 2m i=1 m (h( x i ) – y i ) 2
Di sini, h(x) adalah singkatan dari fungsi hipotesis, yang dilambangkan dengan persamaan yang telah kita diskusikan sebelumnya:
h(x) = 0 + 1 x 1 + 2 x 2 +…. + saya x saya
m singkatan dari jumlah total contoh dalam kumpulan data kami.
Dengan menggunakan persamaan ini dan algoritme pengoptimalan, Anda dapat melatih model regresi linier Anda.
Ada banyak metode lain untuk melakukan analisis regresi Python, yang telah kita bahas di bawah ini:
Melakukan Regresi Linier dengan Paket Python
Anda dapat menggunakan NumPy, yang merupakan paket Python yang tersebar luas dan mendasar. Ini digunakan untuk melakukan operasi berkinerja tinggi. Ini adalah open-source dan memiliki banyak rutinitas matematika yang tersedia.
Anda dapat melihat panduan pengguna NumPy untuk mengetahui informasi lebih lanjut tentangnya. Anda juga perlu belajar tentang scikit-learn, yang merupakan pustaka Python populer berdasarkan NumPy. Ini populer digunakan untuk pembelajaran mesin dan aktivitas serupa.
Untuk mengembangkan model regresi linier dan menerapkannya, Anda juga harus mempelajari tentang statsmodels. Ini adalah paket Python kuat lainnya, yang digunakan untuk melakukan tes dan memperkirakan model statistik.
Apa Aplikasi Regresi Linier?
Regresi linier menemukan kegunaan di banyak industri. Berikut adalah beberapa aplikasi regresi linier:
1) Memahami Tren
Regresi linier dapat membantu perusahaan dalam memahami tren pasar. Dengan cara ini, mereka dapat merencanakan strategi mereka dengan lebih baik dan menghindari kesalahan. Selain perusahaan, pedagang, dan juga, organisasi penelitian juga dapat menggunakan teknik ini untuk mengevaluasi tren.
2) Menganalisis Perubahan Harga
Perubahan harga komoditas dapat memiliki dampak yang signifikan terhadap keuntungan bisnis produksi. Regresi linier dapat membantu perusahaan dengan tugas ini juga, karena mereka dapat menemukan hubungan antara perubahan harga dan faktor-faktor yang berkontribusi terhadapnya.

3) Penilaian Risiko
Perusahaan asuransi, serta investor, dapat menggunakan regresi linier untuk mengetahui anomali. Investor dapat menemukan investasi mereka yang lemah dan merencanakan strategi mereka dengan tepat sambil mengurangi risiko.
Kesimpulan
Regresi Linier adalah salah satu algoritme AI yang penting dan kami harap panduan tentang regresi linier dengan Python ini bermanfaat bagi Anda. Regresi Python bisa sangat menakutkan bagi seorang pemula. Itu sebabnya kami menyarankan untuk membiasakan diri dengan paket dan algoritme Python terlebih dahulu.
Jika Anda tertarik untuk mempelajari lebih lanjut tentang Pembelajaran Mesin, lihat Program PG Eksekutif IIIT-B & upGrad dalam Pembelajaran Mesin & AI yang dirancang untuk para profesional yang bekerja dan menawarkan 450+ jam pelatihan ketat, 30+ studi kasus & tugas, IIIT -B Status Alumni, 5+ proyek batu penjuru praktis & bantuan pekerjaan dengan perusahaan-perusahaan top.
Mengetahui tentang keduanya saja akan sangat bermanfaat bagi Anda dalam menerapkan regresi linier.
Kapan kita menggunakan regresi?
Ketika banyak variabel hadir dalam suatu masalah, kita mungkin ingin memahami hubungan antara semuanya. Kita dapat menggunakan matriks untuk mengetahui hubungan potensial antara pasangan variabel tertentu. Dengan menggunakan metode korelasi, kita dapat mengukur hubungan linier antara setiap pasangan variabel. Namun, metode ini tidak memadai bila kita ingin mengetahui hubungan kompleks yang melibatkan beberapa variabel. Dalam kasus seperti itu, regresi adalah metode yang lebih efektif untuk memahami hubungan kompleks antara banyak variabel. Regresi membantu kita mengetahui variabel mana yang memengaruhi respons tertentu dan bagaimana variabel tersebut dapat menjelaskan hasil tertentu.
Berapa banyak jenis regresi yang digunakan dalam pembelajaran mesin?
Regresi adalah teknik yang dengannya kita dapat memprediksi hasil masa depan antara variabel target dan satu atau beberapa variabel prediktor independen. Regresi sangat umum digunakan dalam pembelajaran mesin untuk pemodelan deret waktu, peramalan, dan pemahaman hubungan sebab-akibat antara variabel yang berbeda. Berbagai jenis regresi yang digunakan dalam pembelajaran mesin adalah regresi linier, regresi logistik, regresi punggungan, regresi polinomial, dan regresi laso. Anda dapat menemukan lebih banyak jenis metode analisis regresi yang digunakan dalam pembelajaran mesin. Namun, ini adalah metode yang paling banyak digunakan di antara yang lainnya.
Apa keuntungan menggunakan Python?
Python adalah salah satu bahasa pemrograman yang paling umum digunakan dalam pembelajaran mesin. Muncul dengan beberapa keunggulan. Pertama, sintaks Python sangat mudah. Mudah dipelajari dan dipahami, yang membuatnya sangat populer di kalangan pemula maupun programmer berpengalaman. Selanjutnya, ini adalah open-source dan gratis untuk digunakan dan dilengkapi dengan komunitas besar pengembang dan peneliti aktif. Pustaka fungsi yang ekstensif di inti Python menawarkan dukungan komprehensif untuk pengembang, jadi tidak perlu bergantung pada pustaka eksternal atau pihak ketiga. Selain itu, Python sangat fleksibel dan tidak bergantung pada sistem, tidak seperti beberapa bahasa pemrograman lain seperti C dan C++.