Enam Struktur Data Yang Paling Umum Digunakan di R

Diterbitkan: 2020-02-03

Sebagai pemrogram dan pembuat kode perangkat lunak, Anda harus menyadari perlunya variabel untuk menyimpan data. Variabel ini dicadangkan di lokasi memori yang berbeda untuk menyimpan nilai. Jadi, membuat variabel berarti menyimpan beberapa ruang di memori. Data inilah yang diatur oleh struktur data agar dapat digunakan secara efisien dalam komputer.

Tidak seperti bahasa pemrograman populer seperti C dan Java, R tidak memiliki variabel untuk dideklarasikan sebagai data. R memiliki objek-R (struktur data) yang menjadi tipe data dari variabel yang dibutuhkan. Ada berbagai jenis struktur data di R. Tapi pertama-tama, mari kita pahami apa itu struktur data!

Daftar isi

Apa itu Struktur Data?

Dalam R, struktur data adalah alat yang menyimpan banyak nilai. Perhatikan bahwa dalam pemrograman R, data dengan nilai tunggal hampir tidak pernah digunakan. Lebih layak menggunakan R untuk menggabungkan beberapa angka, kata, atau nilai dari jenis yang berbeda bersama-sama. Di sinilah struktur data muncul. Mereka mengelompokkan beberapa nilai ini bersama-sama untuk mempermudah bekerja dengan sejumlah besar data sekaligus.

Struktur data terdiri dari tipe data yang menentukan jenis data yang disimpan dalam nilai z. Misalnya, angka 13 adalah tipe data numerik , sedangkan “ tiga belas ” memiliki tipe data karakter , juga disebut string.

Sekarang setelah Anda memahaminya, mari kita lihat tipe struktur data yang berbeda.

Jenis Struktur Data

Untuk membuat analisis dan operasi data menjadi mudah dan efisien, ada lima jenis utama struktur data dalam pemrograman R.

Mari kita lihat masing-masing secara rinci.

  • vektor

Fungsi dari R Vectors adalah untuk mengelompokkan beberapa nilai dari tipe data yang sama. Ini adalah tipe paling dasar dari struktur data dalam R dan memiliki dua bagian: Vektor dan Daftar Atom. Berikut ini adalah sifat umum mereka:

  • Jenis fungsi (apa itu)
  • Panjang fungsi (jumlah elemen)
  • Atribut fungsi (metadata arbitrer tambahan)

Sekarang, sementara Vektor Atom dimaksudkan untuk mengelompokkan tipe data yang sama, daftar dapat mengelompokkan tipe data yang berbeda. Ada empat jenis Vektor Atom:

  • Tipe Data Numerik
  • Tipe Data Bulat
  • Tipe Data Karakter
  • Tipe Data Logis

Anda dapat membuat Vektor menggunakan fungsi c().

Sebagai contoh:

Jika Anda menjalankan kode di atas, sebuah vektor dengan nama 'Vector ini' akan dibuat, berisi semua angka dari 1 hingga 30.

Untuk menyimpan nilai karakter dalam Vektor, Anda harus menggunakan tanda kutip ganda seperti:


Meskipun Anda dapat menyimpan tipe data yang berbeda dalam sebuah vektor, Anda disarankan untuk tidak menyimpannya karena semua nilai dikonversi menjadi tipe karakter.

  • Daftar

Seperti disebutkan di atas, Daftar dapat berisi semua jenis elemen data – string, angka, vektor, dan bahkan daftar lainnya. Misalnya, Anda dapat membuat daftar 80 angka, 30 kata, dan 42 vektor. Fungsi yang akan digunakan adalah list().

Contoh:


Keluaran:

Karena Daftar dapat memiliki daftar lain juga, mereka kadang-kadang disebut Vektor rekursif . Inilah sebabnya mengapa mereka sangat berbeda dari Vektor Atom.

  1. Faktor

Sederhananya, faktor adalah jenis vektor di mana hanya nilai yang telah ditentukan yang dapat disimpan. Hal ini terutama digunakan untuk menyimpan data kategorikal. Mereka mengkategorikan nilai kolom, seperti “Pria”, “Wanita”, “TRUE”, “FALSE”, dll.

Faktor bersifat heterogen dalam arti bahwa string dan bilangan bulat dapat disimpan di dalamnya. Untuk membuat faktor, gunakan fungsi faktor(). Mereka sangat berguna ketika ada banyak kemungkinan nilai untuk variabel tertentu dan Anda mengetahui semuanya.

Dalam pemrograman R, vektor karakter secara otomatis diubah menjadi vektor. Anda dapat menggunakan stringsAsFactors = FALSE untuk menekan ini dan kemudian secara manual mengonversi setiap vektor karakter menjadi faktor.

  • Bingkai Data

Struktur data dalam R ini digunakan untuk merepresentasikan data dalam bentuk tabel untuk mempermudah analisis data. Ini berisi vektor dengan panjang yang sama, sehingga membentuk struktur dua dimensi. Ada kolom yang berisi nilai-nilai variabel dan baris yang berisi sekumpulan nilai dari setiap kolom.

Secara alami, bingkai data dapat menyimpan nilai dari tipe data yang berbeda. Namun, setiap kolom harus memiliki jumlah elemen yang sama. Misalnya, jika kolom 1 memiliki 5 elemen, kolom 2 juga harus memiliki 5 nilai.

Bingkai data memiliki beberapa karakteristik khusus:

  • Nama kolom tidak boleh dibiarkan kosong.
  • Nama setiap baris harus unik.
  • Anda dapat menyimpan data numerik, faktor, atau tipe karakter dalam bingkai data.
  • Semua kolom harus berisi jumlah elemen data yang sama.

Semua kumpulan data yang diimpor dalam R secara otomatis disimpan sebagai bingkai data.

  • Matriks

Struktur data matriks di R berdiri di antara Vektor dan Bingkai Data. Matriks adalah kumpulan data dua dimensi yang hanya dapat berisi elemen dengan tipe data yang sama. Anda dapat membuat matriks menggunakan matriks fungsi ().

Sintaks : matriks(data, nrow, ncol, byrow, dimnames)

Di Sini,

data = elemen masukan sebagai vektor

nrow = jumlah baris

ncol = jumlah kolom

byrow = pengaturan baris-bijaksana

dimnames = nama kolom/baris

Contoh:

Keluaran:

Meskipun faktor terlihat dan berperilaku seperti vektor karakter, sebenarnya mereka adalah bilangan bulat. Untuk mengonversi faktor menjadi sengatan, gunakan fungsi seperti gsub() dan grepl(). Menggunakan nchar() akan menembak kesalahan.

  • Array

Array adalah matriks multidimensi. Matriks adalah kasus khusus dari array yang memiliki dua dimensi. Sementara matriks umumnya digunakan, array sangat jarang.

Fungsi untuk membuat array adalah array().

Menguji apakah suatu objek adalah matriks atau array cukup sederhana. Cukup gunakan fungsi is.matrix() atau is.array() .

Latihan

Berikut adalah beberapa pertanyaan yang dapat Anda coba jawab sekarang setelah Anda memperoleh pengetahuan yang cukup tentang struktur data di R.

  1. Apa atribut dari bingkai data?
  2. Bisakah bingkai data berisi 0 baris atau kolom?
  3. Apa saja jenis-jenis Vektor Atom di R?
  4. Apa perbedaan antara Vektor dan Daftar Atom?
  5. Buat matriks 4X3 di R.

Kirim jawaban Anda kepada kami melalui email atau tulis di komentar di bawah!

Kesimpulan

Untuk memanfaatkan bahasa R secara memadai, pemahaman yang baik tentang tipe data, struktur data, dan cara kerjanya adalah penting. Item ini adalah premis dari semua aktivitas di R. Misalnya, masalah umum yang dihadapi oleh sebagian besar programmer adalah transformasi objek, yang dapat dihilangkan dengan pengetahuan yang baik tentang objek R. Sangat penting untuk dicatat bahwa dalam R semuanya adalah objek dan operasi telah berjalan sebagai panggilan fungsi.

Struktur data dalam R dapat disortir dengan dua cara berbeda. Metode utama untuk menyortir struktur data adalah dengan dimensinya yang dapat berupa dimensi 1, 2, atau n dan rute selanjutnya adalah dengan sifat elemennya yang dapat homogen atau heterogen. Setiap unsur dalam struktur homogen harus sejenis sedangkan dalam struktur heterogen, unsur-unsur dengan berbagai jenis diperbolehkan.

Setelah mempelajari dasar-dasar struktur data dalam R, Anda akan menemukan pemrograman dalam R jauh lebih mudah. Struktur data adalah dasar dari R. Enam struktur data yang paling umum digunakan disebutkan di atas. Penting untuk mengingat karakteristik yang berbeda dari setiap jenis dan menerapkannya untuk menganalisis data dan menjalankan operasinya.

Jika Anda tertarik untuk mengetahui lebih banyak tentang Big Data, lihat Diploma PG kami dalam Spesialisasi Pengembangan Perangkat Lunak dalam program Big Data yang dirancang untuk para profesional yang bekerja dan menyediakan 7+ studi kasus & proyek, mencakup 14 bahasa & alat pemrograman, praktik langsung lokakarya, lebih dari 400 jam pembelajaran yang ketat & bantuan penempatan kerja dengan perusahaan-perusahaan top.

Pelajari Kursus Pengembangan Perangkat Lunak online dari Universitas top dunia. Dapatkan Program PG Eksekutif, Program Sertifikat Tingkat Lanjut, atau Program Magister untuk mempercepat karier Anda.

Tingkatkan Kemampuan Diri Anda & Bersiaplah untuk Masa Depan

Program Sertifikat Tingkat Lanjut dalam Data Besar dari IIIT Bangalore