Jenis-Jenis Algoritma Kecerdasan Buatan Yang Harus Anda Ketahui [Panduan Lengkap]

Diterbitkan: 2019-11-13

Kecerdasan Buatan telah berkembang untuk memiliki dampak yang signifikan pada dunia. Dengan sejumlah besar data yang dihasilkan oleh aplikasi dan sumber yang berbeda, sistem pembelajaran mesin dapat belajar dari data pengujian dan melakukan tugas-tugas cerdas.

Kecerdasan Buatan adalah bidang ilmu komputer yang berhubungan dengan menanamkan kemampuan menentukan dan kemampuan berpikir untuk mesin. Kecerdasan Buatan dengan demikian merupakan perpaduan antara ilmu komputer, analisis data, dan matematika murni.

Machine learning menjadi bagian integral dari Artificial Intelligence, dan hanya berurusan dengan bagian pertama, proses belajar dari data input. Kecerdasan Buatan dan manfaatnya tidak pernah berhenti membuat kita takjub.

Bergabunglah dengan Kursus AI online dari Universitas top dunia – Magister, Program Pascasarjana Eksekutif, dan Program Sertifikat Tingkat Lanjut di ML & AI untuk mempercepat karier Anda.

Daftar isi

Jenis Algoritma Kecerdasan Buatan
- 1. Algoritma Klasifikasi
  - a) Naif Bayes
  - b) Pohon Keputusan
  - c) Hutan Acak
  - d) Mendukung Mesin Vektor
  - e) K Tetangga Terdekat
- 2. Algoritma Regresi
  - a) Regresi Linier
  - b) Regresi Lasso
  - c) Regresi Logistik
  - d) Regresi Multivariat
  - e) Algoritma Regresi Berganda
- 3. Algoritma Pengelompokan
  - a) Pengelompokan K-Means
  - b) Algoritma Fuzzy C-means
  - c) Algoritma Ekspektasi-Maximisasi (EM)
  - d) Algoritma Pengelompokan Hirarki
Mari kita tutup dan simpulkan
Apa itu naif bayes?
Apa itu pohon keputusan?
Apa itu mesin vektor pendukung?

Jenis Algoritma Kecerdasan Buatan

Algoritma kecerdasan buatan dapat secara luas diklasifikasikan sebagai:

1. Algoritma Klasifikasi

Algoritma klasifikasi adalah bagian dari pembelajaran terawasi. Algoritma ini digunakan untuk membagi variabel yang dikenai menjadi kelas yang berbeda dan kemudian memprediksi kelas untuk input yang diberikan. Misalnya, algoritma klasifikasi dapat digunakan untuk mengklasifikasikan email sebagai spam atau tidak. Mari kita bahas beberapa algoritma klasifikasi yang umum digunakan.

a) Naif Bayes

Algoritma Naive Bayes bekerja pada teorema Bayes dan mengambil pendekatan probabilistik, tidak seperti algoritma klasifikasi lainnya. Algoritma memiliki serangkaian probabilitas sebelumnya untuk setiap kelas. Setelah data dimasukkan, algoritme memperbarui probabilitas ini untuk membentuk sesuatu yang dikenal sebagai probabilitas posterior. Ini berguna ketika Anda perlu memprediksi apakah input termasuk dalam daftar kelas yang diberikan atau tidak.

b) Pohon Keputusan

Algoritma pohon keputusan lebih merupakan diagram alur seperti algoritma di mana node mewakili pengujian pada atribut input dan cabang mewakili hasil pengujian.

c) Hutan Acak

Hutan acak bekerja seperti sekelompok pohon. Kumpulan data input dibagi lagi dan dimasukkan ke dalam pohon keputusan yang berbeda. Rata-rata keluaran dari semua pohon keputusan dipertimbangkan. Hutan acak menawarkan pengklasifikasi yang lebih akurat dibandingkan dengan algoritma pohon keputusan.

d) Mendukung Mesin Vektor

SVM adalah algoritma yang mengklasifikasikan data menggunakan hyperplane, memastikan jarak antara hyperplane dan support vector maksimal.

e) K Tetangga Terdekat

Algoritma KNN menggunakan sekelompok titik data yang dipisahkan ke dalam kelas untuk memprediksi kelas titik data sampel baru. Ini disebut "algoritma pembelajaran malas" karena relatif singkat dibandingkan dengan algoritma lain.

2. Algoritma Regresi

Algoritma regresi adalah algoritma populer di bawah algoritma pembelajaran mesin yang diawasi. Algoritma regresi dapat memprediksi nilai keluaran berdasarkan titik data masukan yang dimasukkan dalam sistem pembelajaran. Aplikasi utama dari algoritma regresi termasuk memprediksi harga pasar saham, memprediksi cuaca, dll. Algoritma yang paling umum di bawah bagian ini adalah

a) Regresi Linier

Ini digunakan untuk mengukur kualitas asli dengan mempertimbangkan variabel yang konsisten. Ini adalah yang paling sederhana dari semua algoritma regresi tetapi hanya dapat diimplementasikan dalam kasus hubungan linier atau masalah yang dapat dipisahkan secara linier. Algoritme menggambar garis lurus antara titik data yang disebut garis paling cocok atau garis regresi dan digunakan untuk memprediksi nilai baru.

Baca: Regresi Linier – Tanya Jawab Wawancara ML

b) Regresi Lasso

Algoritma regresi Lasso bekerja dengan mendapatkan subset dari prediktor yang meminimalkan kesalahan prediksi untuk variabel respon. Hal ini dicapai dengan memberlakukan batasan pada titik data dan memungkinkan beberapa di antaranya menyusut ke nilai nol.

c) Regresi Logistik

Regresi logistik terutama digunakan untuk klasifikasi biner. Metode ini memungkinkan Anda untuk menganalisis satu set variabel dan memprediksi hasil kategoris. Aplikasi utamanya termasuk memprediksi nilai umur pelanggan, nilai rumah, dll

d) Regresi Multivariat

Algoritma ini harus digunakan ketika ada lebih dari satu variabel prediktor. Algoritme ini banyak digunakan di mesin rekomendasi produk sektor ritel, di mana produk pilihan pelanggan akan bergantung pada banyak faktor seperti merek, kualitas, harga, ulasan, dll.

e) Algoritma Regresi Berganda

Algoritma Regresi Berganda menggunakan kombinasi dari regresi linier dan algoritma regresi non-linier yang mengambil beberapa variabel penjelas sebagai input. Aplikasi utama termasuk penelitian ilmu sosial, keaslian klaim asuransi, analisis perilaku, dll.

3. Algoritma Pengelompokan

Clustering adalah proses pemisahan dan pengorganisasian titik-titik data ke dalam kelompok-kelompok berdasarkan kesamaan dalam anggota kelompok. Ini adalah bagian dari pembelajaran tanpa pengawasan. Tujuan utamanya adalah untuk mengelompokkan barang-barang serupa. Misalnya, dapat mengatur semua transaksi yang bersifat penipuan secara bersama-sama berdasarkan beberapa properti dalam transaksi tersebut. Di bawah ini adalah algoritma pengelompokan yang paling umum.

a) Pengelompokan K-Means

Ini adalah algoritma pembelajaran tanpa pengawasan yang paling sederhana. Algoritme mengumpulkan titik data yang serupa bersama-sama dan kemudian mengikatnya menjadi sebuah cluster. Clustering dilakukan dengan menghitung centroid dari kelompok titik data kemudian mengevaluasi jarak setiap titik data dari centroid cluster. Berdasarkan jarak, titik data yang dianalisis kemudian ditugaskan ke cluster terdekat. 'K' dalam K-means adalah singkatan dari jumlah cluster tempat titik data dikelompokkan.

b) Algoritma Fuzzy C-means

Algoritma FCM bekerja pada probabilitas. Setiap titik data dianggap memiliki kemungkinan menjadi bagian dari cluster lain. Titik data tidak memiliki keanggotaan mutlak pada cluster tertentu, dan inilah mengapa algoritma ini disebut fuzzy.

c) Algoritma Ekspektasi-Maximisasi (EM)

Ini didasarkan pada distribusi Gaussian yang kita pelajari dalam statistik. Data digambarkan ke dalam model distribusi Gaussian untuk memecahkan masalah tersebut. Setelah menetapkan probabilitas, sampel titik dihitung berdasarkan persamaan ekspektasi dan maksimalisasi.

d) Algoritma Pengelompokan Hirarki

Algoritme ini mengurutkan klaster urutan hierarkis setelah mempelajari titik data dan melakukan pengamatan kesamaan. Itu bisa dari dua jenis

Pengelompokan yang memecah belah, untuk pendekatan top-down
Pengelompokan aglomeratif, untuk pendekatan bottom-up

Mari kita tutup dan simpulkan

AI telah mengejutkan dunia beberapa kali dan memiliki banyak aplikasi di dunia nyata untuk memecahkan masalah kompleksnya. Kami berharap artikel ini menjelaskan berbagai algoritma Kecerdasan Buatan dan klasifikasinya yang luas. Algoritma dipilih berdasarkan kebutuhan dan sifat titik data yang kita miliki.

Algoritma memiliki kelebihan dan kekurangan dalam hal akurasi, kinerja dan waktu pemrosesan. Ini hanya beberapa algoritma. Jika Anda tertarik untuk belajar lebih banyak, lihat Program PG Eksekutif upGrad & IIIT-B dalam Pembelajaran Mesin & AI .

Apa itu naif bayes?

Teorema Bayes digunakan dalam algoritma Naive Bayes, yang, tidak seperti algoritma lain dalam daftar ini, mengambil pendekatan probabilistik. Ini berarti bahwa metode ini memiliki serangkaian probabilitas sebelumnya yang ditetapkan untuk setiap klasifikasi untuk target Anda, daripada melompat langsung ke data. Algoritme mengubah probabilitas sebelumnya ini untuk menghasilkan probabilitas posterior saat Anda memasukkan data. Akibatnya, ini bisa sangat bermanfaat dalam situasi ketika Anda perlu mengantisipasi apakah input Anda sesuai dengan salah satu dari n kelas atau tidak sama sekali. Hal ini dapat dilakukan dengan menggunakan teknik probabilistik karena probabilitas yang dilempar untuk semua n kelas akan cukup rendah.

Apa itu pohon keputusan?

Pohon Keputusan hanyalah struktur pohon seperti diagram alur di mana setiap simpul luar mewakili percobaan pada atribut dan setiap cabang menunjukkan hasil tes. Label yang diharapkan disimpan di simpul daun. Kita mulai dari akar pohon dan menuju ke simpul daun dengan membandingkan nilai atribut. Saat menangani data berdimensi tinggi dan dengan sedikit waktu yang dihabiskan untuk persiapan data, kami menggunakan pengklasifikasi ini. Namun, perlu diingat: mereka rentan terhadap overfitting dan dapat bervariasi secara dramatis bahkan dengan sedikit perubahan dalam data pelatihan.

Apa itu mesin vektor pendukung?

Sejauh ia mencoba untuk mengurutkan titik data dengan margin antara dua kelas selebar mungkin, SVM adalah unik. Ini disebut sebagai pemisahan margin maksimum. Hal lain yang perlu diingat adalah bahwa, tidak seperti regresi linier, SVM memplot hyperplane hanya menggunakan vektor pendukung, sedangkan regresi linier menggunakan kumpulan data lengkap. SVM sangat bermanfaat dalam situasi ketika data memiliki banyak dimensi. Jadi Anda mulai dengan membuat hyperplane acak, lalu mengukur jarak antara hyperplane tersebut dan nilai data terdekat dari setiap kelas. Support vector adalah titik data yang paling dekat dengan hyperplane.