Tutorial Azure: Memprediksi Harga Gas Menggunakan Azure Machine Learning Studio
Diterbitkan: 2022-03-11Bagaimana jika Anda bisa memprediksi apakah saham pilihan Anda akan naik atau turun selama bulan depan? Atau apakah tim sepak bola favorit Anda akan menang atau kalah di pertandingan berikutnya? Bagaimana Anda bisa membuat prediksi seperti itu? Mungkin pembelajaran mesin dapat memberikan sebagian dari jawabannya. Cortana, asisten pribadi digital baru yang didukung oleh Bing yang hadir dengan Windows Phone 8.1 secara akurat memprediksi 15 dari 16 pertandingan di Piala Dunia FIFA 2014.
Dalam tutorial Azure ini, kita akan mengeksplorasi fitur dan kemampuan Azure Machine Learning melalui pemecahan salah satu masalah yang kita hadapi dalam kehidupan sehari-hari.
Dari sudut pandang pengembang pembelajaran mesin, masalah dapat dibagi menjadi dua kelompok - masalah yang dapat diselesaikan menggunakan metode standar, dan masalah yang tidak dapat diselesaikan menggunakan metode standar. Sayangnya, sebagian besar masalah kehidupan nyata termasuk dalam kelompok kedua. Di sinilah pembelajaran mesin berperan. Ide dasarnya adalah menggunakan mesin untuk menemukan pola yang berarti dalam data historis dan menggunakannya untuk memecahkan masalah.
Masalah
Harga gas mungkin salah satu item yang sudah ada di anggaran kebanyakan orang. Kenaikan atau penurunan yang konstan dapat mempengaruhi harga bahan makanan dan layanan lainnya juga. Ada banyak faktor yang dapat mempengaruhi harga gas, mulai dari kondisi cuaca hingga keputusan politik dan biaya administrasi, dan hingga faktor yang sama sekali tidak terduga seperti bencana alam atau perang.
Rencana untuk tutorial pembelajaran mesin Azure ini adalah untuk menyelidiki beberapa data yang dapat diakses dan menemukan korelasi yang dapat dieksploitasi untuk membuat model prediksi.
Studio Pembelajaran Mesin Azure
Azure Machine Learning Studio adalah lingkungan pengembangan terintegrasi (IDE) berbasis web untuk mengembangkan eksperimen data. Ini terkait erat dengan layanan cloud Azure lainnya dan menyederhanakan pengembangan dan penerapan model dan layanan pembelajaran mesin.
Membuat Eksperimen
Ada lima langkah dasar untuk membuat contoh pembelajaran mesin. Kami akan memeriksa setiap langkah ini dengan mengembangkan model prediksi kami sendiri untuk harga gas.
Mendapatkan Data
Mengumpulkan data adalah salah satu langkah terpenting dalam proses ini. Relevansi dan kejelasan data menjadi dasar untuk membuat model prediksi yang baik. Azure Machine Learning Studio menyediakan sejumlah kumpulan data sampel. Kumpulan kumpulan data hebat lainnya dapat ditemukan di archive.ics.uci.edu/ml/datasets.html.
Setelah mengumpulkan data, kami perlu mengunggahnya ke Studio melalui mekanisme pengunggahan data sederhana mereka:
Setelah diunggah, kami dapat melihat pratinjau data. Gambar berikut menunjukkan sebagian dari data kami yang baru saja kami unggah. Tujuan kami di sini adalah untuk memprediksi harga di bawah kolom berlabel E95.
Langkah kita selanjutnya adalah membuat eksperimen baru dengan menarik dan melepas modul dari panel di sebelah kiri ke area kerja.
Data Prapemrosesan
Pra-pemrosesan data yang tersedia melibatkan penyesuaian data yang tersedia dengan kebutuhan Anda. Modul pertama yang akan kita gunakan di sini adalah “Statistik Deskriptif”. Ini menghitung data statistik dari data yang tersedia. Selain modul “Descriptive Statistics”, salah satu modul yang umum digunakan adalah “Clean Missing Data”. Tujuan dari langkah ini adalah untuk memberi makna pada nilai yang hilang (null) dengan menggantinya dengan beberapa nilai lain atau dengan menghapusnya sama sekali.
Mendefinisikan Fitur
Modul lain yang diterapkan pada langkah ini dalam tutorial kami adalah modul "Pemilihan Fitur Berbasis Filter". Modul ini menentukan fitur kumpulan data yang paling relevan dengan hasil yang ingin kita prediksi. Dalam hal ini, seperti yang Anda lihat pada gambar di bawah, empat fitur yang paling relevan untuk nilai “E95” adalah “EDG BS”, “Oil”, “USD/HRK”, dan “EUR/USD”.
Karena “EDG BS” adalah nilai “output” lain yang tidak dapat digunakan untuk membuat prediksi, kami hanya akan memilih dua dari fitur penting lainnya - yaitu harga minyak, dan nilai tukar mata uang di kolom USD/HRK.
Contoh dataset setelah diproses ditunjukkan di bawah ini:

Memilih dan Menerapkan Algoritma
Langkah kita selanjutnya adalah membagi data yang tersedia menggunakan modul “Split”. Bagian pertama dari data (dalam kasus kami 80%) akan digunakan untuk melatih model dan sisanya digunakan untuk menilai model yang dilatih.
Langkah-langkah berikut adalah langkah terpenting dalam seluruh proses pembelajaran mesin Azure. Modul "Model Kereta" menerima dua parameter input. Pertama adalah data pelatihan mentah, dan yang lainnya adalah algoritma pembelajaran. Di sini, kita akan menggunakan algoritma "Regresi Linier". Output dari modul “Train Model” adalah salah satu parameter input dari modul “Score Model”. Yang lainnya adalah sisa data yang tersedia. Model Skor menambahkan kolom baru ke dataset kami, Label Skor. Nilai di bawah kolom "Label Skor" lebih dekat dengan nilai nilai E95 yang sesuai ketika algoritme pembelajaran yang diterapkan bekerja dengan baik dengan data yang tersedia.
Modul Evaluasi Model memberi kita evaluasi model terlatih yang dinyatakan dalam nilai statistik. Jika kita melihat pada “Koefisien Determinasi”, kita dapat menyimpulkan bahwa ada kemungkinan sekitar 80% untuk memprediksi harga yang benar menggunakan model ini.
Sekarang, patut dicoba untuk menggunakan modul “Neural Network Regression”. Kita perlu menambahkan modul "Model Kereta" dan "Model Skor" baru dan menghubungkan output ke modul "Evaluasi Model" yang ada.
Modul “Neural Network Regression” memerlukan konfigurasi yang lebih banyak. Karena ini adalah modul terpenting dari keseluruhan eksperimen, di sinilah kita harus memfokuskan upaya kita, menyesuaikan dan bereksperimen dengan pengaturan dan pemilihan algoritme pembelajaran yang sesuai secara keseluruhan.
Dalam hal ini, modul Evaluasi memberi kita perbandingan dua model terlatih kami. Sekali lagi, berdasarkan Koefisien Determinasi kita melihat bahwa Neural Networks memberikan prediksi yang sedikit kurang akurat.
Pada titik ini kita dapat menyimpan model terlatih yang dipilih untuk digunakan di masa mendatang.
Ketika kami memiliki model yang terlatih, kami dapat melanjutkan dengan membuat "Eksperimen Skor". Itu dapat dilakukan dengan membuat eksperimen baru dari awal atau dengan menggunakan bantuan Azure Machine Learning Studio. Cukup pilih model terlatih dan klik "Buat Eksperimen Skor". Modul baru yang kita butuhkan disini adalah “Web service input” dan “Web service output”. Kami akan menambahkan modul "Kolom Proyek" untuk memilih nilai input dan output kami. Nilai input adalah Minyak dan USD/HRK, dan output adalah nilai prediksi di bawah kolom "Label Skor" dari output "Model Skor".
Gambar di bawah menunjukkan percobaan penilaian kami setelah beberapa penyesuaian ini dan setelah menghubungkan modul "Input layanan web" dan "Output layanan web" yang sesuai.
Fitur pembantu bagus lainnya datang untuk bermain pada saat ini. Dengan "Publikasikan Layanan Web" Anda dapat membuat layanan web sederhana yang dihosting di infrastruktur cloud Azure.
Memprediksi Data Baru
Akhirnya, kami dapat menguji layanan web prediksi kami menggunakan formulir pengujian sederhana.
Kesimpulan
Melalui tutorial pembelajaran mesin sederhana ini, kami telah menunjukkan cara membuat layanan web prediksi yang berfungsi penuh. Azure Machine Learning Studio yang terintegrasi ke dalam platform Azure dapat menjadi alat yang sangat kuat untuk membuat eksperimen data. Selain Machine Learning Studio, ada solusi machine learning lainnya seperti Orange dan Tiberious. Terlepas dari lingkungan pengembangan yang Anda sukai, saya mendorong Anda untuk menjelajahi pembelajaran mesin dan menemukan ilmuwan data batin Anda.