Cara Membuat Pohon Keputusan Sempurna | Algoritma Pohon Keputusan [Dengan Contoh]

Diterbitkan: 2020-03-30

Jika Anda bertanya-tanya 'bagaimana cara membuat pohon keputusan' atau 'dapatkah saya membuat pohon keputusan di Jawa,' Anda datang ke tempat yang tepat. Dalam artikel ini, kita akan menemukan jawaban atas pertanyaan seperti itu karena kita akan membahas pohon keputusan secara rinci. Anda akan mengetahui apa itu, mengapa mereka begitu populer, dan bagaimana Anda bisa membuatnya.

Sebelum Anda membuat pohon keputusan, Anda harus terbiasa dengan beberapa topik lain seperti Regresi Linier dan algoritma.

Baca lebih lanjut: Pohon Keputusan di R

Daftar isi

Apa itu Pohon Keputusan?

Pohon keputusan memberi Anda peta semua kemungkinan hasil dari pilihan tertentu. Ini dapat membantu Anda merencanakan tindakan masa depan di bawah skenario yang berbeda sesuai dengan pilihan yang berbeda. Anda dapat membandingkan hasil yang mungkin berdasarkan probabilitas dan biayanya.

Seperti namanya, pohon keputusan menunjukkan grafik yang menyerupai pohon. Ini adalah model keputusan, bersama dengan hasil dan konsekuensi dari setiap keputusan. Tujuan utamanya adalah untuk membantu Anda melakukan klasifikasi dengan benar sambil melewati jumlah pilihan serendah mungkin.

Anda dapat merepresentasikan fungsi boolean dengan menggunakan pohon keputusan juga. Setiap simpul daun dari pohon keputusan adalah label kelas, dan simpul internal pohon menunjukkan atribut. Mereka mulai dengan satu simpul dan kemudian bercabang ke semua kemungkinan. Setiap cabang tersebut mengarah ke lebih banyak simpul yang mewakili konsekuensi lain yang mungkin terjadi. Anda dapat membuat pohon keputusan di Jawa.

Sebuah pohon keputusan memiliki berbagai jenis node:

  • Node Keputusan
  • Node Peluang
  • Node Akhir

Node akhir mencerminkan hasil akhir dari jalur keputusan sementara node peluang menunjukkan peluang hasil tertentu. Node keputusan menunjukkan keputusan yang akan Anda buat yang akan mengarah pada kemungkinan hasil. Anda dapat menggunakan pohon keputusan untuk memetakan prediksi algoritmik serta membuat keputusan informal.

Sekarang setelah Anda mengetahui apa itu pohon keputusan, kita harus fokus menggali lebih dalam dan memahami mengapa pohon itu lazim. Mari selami.

Aplikasi Pohon Keputusan

Berikut adalah beberapa aplikasi pohon keputusan sehingga Anda dapat melihat seberapa lazimnya mereka:

  • Bank menggunakannya untuk mengklasifikasikan aplikasi pinjaman mereka
  • Profesional keuangan menggunakan pohon keputusan untuk penetapan harga opsi
  • Mengkategorikan kertas ujian sesuai dengan tingkat keahlian kandidat
  • Memilih apakah akan menerima atau menolak tawaran pekerjaan
  • Membuat keputusan bisnis penting seperti apakah perusahaan harus memodifikasi produknya atau tidak.

Anda pasti pernah menggunakan pohon keputusan sendiri dalam membuat berbagai pilihan dalam hidup Anda. Buat saja beberapa skenario di mana Anda harus membuat keputusan yang rumit.

Keuntungan Pohon Keputusan

Ada banyak keuntungan menggunakan pohon keputusan. Inilah mereka:

  • Pohon keputusan menghasilkan aturan yang dapat Anda pahami dengan mudah. Anda tidak akan kesulitan menyampaikan aturan tersebut ke sistem lain.
  • Mereka dapat menangani variabel kategoris maupun kontinu
  • Pohon keputusan akan memberi Anda indikasi sederhana tentang pentingnya setiap bidang. Anda dapat dengan mudah membuat prediksi (atau klasifikasi) menurut yang sama.
  • Pohon keputusan juga melakukan pemilihan fitur secara implisit yang membantu Anda dengan eksplorasi data.

Pelajari lebih lanjut: Algoritma Kecerdasan Buatan

Kekurangan Pohon Keputusan

Semuanya memiliki kekurangannya, dan pohon keputusan tidak terkecuali. Berikut adalah beberapa masalah dengan menggunakannya:

  • Pohon keputusan tidak berguna untuk melakukan tugas estimasi. Itu karena pekerjaan seperti itu memerlukan prediksi nilai atribut kontinu, dan pohon keputusan tidak bagus dalam hal itu.
  • Secara komputasi, pohon keputusan lebih mahal daripada opsi lainnya. Anda akan membutuhkan banyak biaya untuk melatih model pohon keputusan juga dibandingkan dengan yang lain. Algoritme pemangkasan yang Anda gunakan dalam membuat pohon keputusan juga cukup mahal karena diperlukan untuk membangun banyak subpohon.
  • Jika Anda memiliki jumlah contoh kelas yang tinggi tetapi jumlah contoh pelatihan yang sedikit, pohon keputusan Anda tidak akan terlalu akurat, dan peluangnya untuk mengandung kesalahan akan sangat tinggi.

Cara Membuat Pohon Keputusan

Mari kita buat pohon keputusan apakah seseorang akan membeli komputer atau tidak. Dalam hal ini, kita akan memiliki dua kelas, 'Ya' dan 'Tidak.' Kelas pertama mengacu pada orang-orang yang akan membeli komputer, sedangkan kelas kedua mengacu pada mereka yang tidak mau. Pertama, kita akan menghitung Information Gain dan Entropy untuk kelas-kelas ini.

Setelah kami menghitung Entropi kelas-kelas ini, kami akan fokus pada perolehan informasi. Kita dapat mengklasifikasikan nilai-nilai Entropi seperti ini:

Jika Entropi 0, berarti data tersebut murni (homogen)

Jika Entropi 1, berarti data tersebut tidak murni (setengah terbagi)

Anggaplah Entropi kita tidak murni. Kemudian kami akan membagi perolehan informasi berdasarkan usia. Dengan cara ini, data kami akan menunjukkan berapa banyak orang dari kelompok usia tertentu yang akan membeli produk ini dan berapa banyak yang tidak. Kita dapat menghitung perolehan informasi untuk beberapa atribut. Namun dalam contoh kami, kami menemukan bahwa perolehan informasi tertinggi untuk 'Usia' dan terendah untuk 'Penghasilan.' Jadi, kita akan pergi dengan itu.

Berikut adalah aturan klasifikasi untuk pohon keputusan ini:

Jika usia seseorang kurang dari 30 tahun dan jika orang tersebut bukan pelajar, mereka tidak akan membeli produk jadi:

Usia (<30) ^ siswa(tidak) = TIDAK

Tetapi jika seseorang yang berusia kurang dari 30 tahun dan masih pelajar, mereka akan membeli produk:

Usia (<30)^ siswa(ya) = YA

Sekarang, jika usia mereka antara 31 dan 40, mereka pasti akan membeli produk:

Umur (31…40) = YA

Seseorang dengan usia lebih tinggi dari 40 dan peringkat kredit yang tinggi tidak akan membeli:

Umur(>40)^ credit_rating(tinggi) = TIDAK

Di sisi lain, jika seseorang yang berusia lebih dari 40 tahun tetapi memiliki peringkat kredit rata-rata, dia akan membeli produk:

Umur(>40)^ credit_rating(normal) = YA

Dengan mengikuti langkah-langkah ini, Anda akan dapat membuat pohon keputusan yang sempurna tanpa kesulitan apa pun .

Ketahui lebih banyak tentang: 9 Perpustakaan Pembelajaran Mesin Teratas yang Harus Anda Ketahui

Kesimpulan

Sekarang Anda harus tahu cara membuat pohon keputusan. Anda dapat mempelajari lebih banyak tentang pohon keputusan dan algoritme yang relevan dalam kursus pembelajaran mesin kami. Kami yakin Anda akan dapat meningkatkan pengetahuan Anda di sana karena Anda akan mempelajari cara membuat pohon keputusan di Java, cara menggunakannya dalam kehidupan nyata, dan banyak lagi.

Jika Anda tertarik untuk mempelajari lebih lanjut tentang pembelajaran mesin, lihat PG Diploma IIIT-B & upGrad dalam Pembelajaran Mesin & AI yang dirancang untuk para profesional yang bekerja dan menawarkan 450+ jam pelatihan ketat, 30+ studi kasus & tugas, IIIT- B Status alumni, 5+ proyek batu penjuru praktis & bantuan pekerjaan dengan perusahaan-perusahaan top.

Pimpin Revolusi Teknologi Berbasis AI

DIPLOMA PG DALAM PEMBELAJARAN MESIN DAN KECERDASAN BUATAN
Lamar Sekarang