4 Jenis Data: Nominal, Ordinal, Diskrit, Kontinu

Diterbitkan: 2020-12-01

Daftar isi

pengantar

Ilmu data adalah tentang bereksperimen dengan data mentah atau terstruktur. Data adalah bahan bakar yang dapat mendorong bisnis ke jalur yang benar atau setidaknya memberikan wawasan yang dapat ditindaklanjuti yang dapat membantu menyusun strategi kampanye saat ini, mengatur peluncuran produk baru dengan mudah, atau mencoba berbagai eksperimen.

Semua hal ini memiliki satu komponen penggerak yang sama dan ini adalah Data. Kami memasuki era digital di mana kami menghasilkan banyak Data. Misalnya, perusahaan seperti Flipkart menghasilkan lebih dari 2TB data setiap hari.

Ketika Data ini sangat penting dalam hidup kita, maka menjadi penting untuk menyimpan dan memproses ini dengan benar tanpa kesalahan. Ketika berhadapan dengan kumpulan data, kategori data memainkan peran penting untuk menentukan strategi prapemrosesan mana yang akan bekerja untuk kumpulan tertentu untuk mendapatkan hasil yang tepat atau jenis analisis statistik mana yang harus diterapkan untuk hasil terbaik. Mari selami beberapa kategori data yang umum digunakan.

Tipe Data Kualitatif

Data Kualitatif atau Kategoris menggambarkan objek yang sedang dipertimbangkan menggunakan sekumpulan kelas diskrit yang terbatas. Artinya, jenis data ini tidak dapat dihitung atau diukur dengan mudah menggunakan angka dan oleh karena itu dibagi ke dalam kategori. Jenis kelamin seseorang (laki-laki, perempuan, atau lainnya) adalah contoh yang baik dari tipe data ini.

Ini biasanya diekstraksi dari audio, gambar, atau media teks. Contoh lain bisa dari merek smartphone yang memberikan informasi tentang peringkat saat ini, warna ponsel, kategori ponsel, dan sebagainya. Semua informasi ini dapat dikategorikan sebagai data Kualitatif. Ada dua subkategori di bawah ini:

Nominal

Ini adalah kumpulan nilai yang tidak memiliki keteraturan alami. Mari kita pahami ini dengan beberapa contoh. Warna smartphone dapat dianggap sebagai tipe data nominal karena kita tidak dapat membandingkan satu warna dengan warna lainnya.

Tidak mungkin untuk menyatakan bahwa 'Merah' lebih besar dari 'Biru'. Jenis kelamin seseorang adalah salah satu di mana kita tidak bisa membedakan antara laki-laki, perempuan, atau orang lain. Kategori ponsel apakah itu kelas menengah, segmen anggaran, atau smartphone premium juga merupakan tipe data nominal.

Baca: Karir di Ilmu Data

Urut

Jenis nilai ini memiliki urutan alami dengan tetap mempertahankan kelas nilainya. Jika kita mempertimbangkan ukuran sebuah merek pakaian maka kita dapat dengan mudah menyortirnya berdasarkan label nama mereka dalam urutan kecil < sedang < besar. Sistem penilaian saat menandai kandidat dalam ujian juga dapat dianggap sebagai tipe data ordinal di mana nilai A+ pasti lebih baik daripada nilai B.

Kategori ini membantu kami memutuskan strategi pengkodean mana yang dapat diterapkan pada jenis data mana. Pengkodean data untuk data Kualitatif penting karena model pembelajaran mesin tidak dapat menangani nilai-nilai ini secara langsung dan perlu dikonversi ke tipe numerik karena modelnya bersifat matematis.

Untuk tipe data nominal yang tidak ada perbandingan antar kategorinya, dapat diterapkan one-hot encoding yang mirip dengan binary coding mengingat jumlahnya lebih sedikit dan untuk tipe data ordinal dapat diterapkan pengkodean label yang merupakan bentuk integer. pengkodean.

Tipe Data Kuantitatif

Tipe data ini mencoba mengukur sesuatu dan melakukannya dengan mempertimbangkan nilai numerik yang membuatnya dapat dihitung secara alami. Harga ponsel cerdas, diskon yang ditawarkan, jumlah peringkat pada suatu produk, frekuensi prosesor ponsel cerdas, atau ram ponsel tersebut, semua ini termasuk dalam kategori tipe data Kuantitatif.

Kuncinya adalah bahwa mungkin ada jumlah nilai yang tidak terbatas yang dapat diambil oleh suatu fitur. Misalnya, harga ponsel cerdas dapat bervariasi dari jumlah x hingga nilai apa pun dan dapat dipecah lebih lanjut berdasarkan nilai pecahan. Dua subkategori yang menggambarkan mereka dengan jelas adalah:

Diskrit

Nilai numerik yang termasuk dalam bilangan bulat atau bilangan bulat ditempatkan di bawah kategori ini. Jumlah speaker di telepon, kamera, core di prosesor, jumlah sim yang didukung semua ini adalah beberapa contoh tipe data diskrit.

Kontinu

Bilangan pecahan dianggap sebagai nilai kontinu. Ini dapat berupa frekuensi operasi prosesor, versi ponsel android, frekuensi wifi, suhu inti, dan sebagainya.

Wajib Dibaca: Gaji Data Scientist di India

Bisakah tipe Ordinal dan Diskrit tumpang tindih?

Jika Anda memperhatikan ini, Anda dapat memberi penomoran pada kelas ordinal, dan kemudian harus disebut tipe diskrit atau ordinal? Yang benar adalah bahwa itu masih ordinal. Alasan untuk ini adalah bahwa meskipun penomoran dilakukan, itu tidak menunjukkan jarak sebenarnya antara kelas.

Misalnya, pertimbangkan sistem penilaian ujian. Nilainya masing-masing bisa A, B, C, D, E, dan jika kita penomoran dari awal maka itu akan menjadi 1,2,3,4,5. Sekarang menurut perbedaan numerik, jarak antara grade E dan grade D sama dengan jarak antara grade D dan C yang tidak terlalu akurat karena kita semua tahu bahwa grade C masih dapat diterima dibandingkan dengan grade E tetapi pertengahan perbedaan menyatakan mereka sebagai sama.

Anda juga dapat menerapkan teknik yang sama pada formulir survei di mana pengalaman pengguna dicatat dalam skala sangat buruk hingga sangat baik. Perbedaan antara berbagai kelas tidak jelas sehingga tidak dapat diukur secara langsung.

Tes yang berbeda

Kami telah membahas semua klasifikasi utama Data. Ini penting karena sekarang kita dapat memprioritaskan pengujian yang akan dilakukan pada kategori yang berbeda. Sekarang masuk akal untuk memplot histogram atau plot frekuensi untuk data kuantitatif dan diagram lingkaran dan plot batang untuk data kualitatif.

Analisis regresi, di mana hubungan antara satu variabel dependen dan dua atau lebih variabel independen dianalisis hanya mungkin untuk data kuantitatif. Uji ANOVA (Analysis of variance) hanya dapat diterapkan pada variabel kualitatif meskipun Anda dapat menerapkan uji ANOVA dua arah yang menggunakan satu variabel pengukuran dan dua variabel nominal.

Dengan cara ini, Anda dapat menerapkan uji Chi-kuadrat pada data kualitatif untuk menemukan hubungan antara variabel kategori.

Kesimpulan

Pada artikel ini, kami membahas bagaimana data yang kami hasilkan dapat membalikkan tabel, bagaimana berbagai kategori data diatur sesuai dengan kebutuhannya. Kami juga melihat bagaimana tipe data ordinal dapat tumpang tindih dengan tipe data diskrit.

Jenis plot apa yang cocok untuk kategori data apa juga dibahas bersama dengan berbagai jenis pengujian yang dapat diterapkan pada jenis data tertentu dan pengujian lain yang menggunakan semua jenis data.

Jika Anda ingin tahu tentang mempelajari ilmu data untuk menjadi yang terdepan dalam kemajuan teknologi yang serba cepat, lihat Sertifikasi Lanjutan dari Grad & IIIT-B dalam Ilmu Data

Mengapa ilmu data penting?

Pentingnya ilmu data terletak pada kenyataan bahwa ia menyatukan keahlian domain dalam pemrograman, matematika, dan statistik untuk menghasilkan wawasan baru dan memahami sejumlah besar data. Bagi perusahaan, ilmu data adalah sumber daya yang signifikan untuk membuat keputusan berdasarkan data karena ilmu data menggambarkan pengumpulan, penyimpanan, penyortiran, dan evaluasi data. Pakar komputer yang sangat berpengalaman sering menggunakannya. Ketika kita bertanya pada diri sendiri mengapa ilmu data itu penting, jawabannya ada karena nilai data terus meningkat. Ilmu data sangat diminati karena menunjukkan bagaimana data digital mengubah organisasi dan memungkinkan mereka membuat pilihan yang lebih terinformasi dan penting.

Apa saja ruang lingkup ilmu data?

Ilmu data dapat ditemukan di mana saja akhir-akhir ini. Itu termasuk transaksi online seperti pembelian Amazon, umpan media sosial seperti Facebook/Instagram, rekomendasi Netflix, dan bahkan kemampuan pengenalan jari dan wajah yang diberikan oleh smartphone. Ilmu Data mencakup banyak ide teknologi mutakhir, seperti Artificial Intelligence, Internet of Things (IoT), dan Deep Learning, untuk menyebutkan beberapa. Efek ilmu data telah tumbuh secara dramatis karena kemajuan dan kemajuan teknisnya, memperluas cakupannya. Dengan mempelajari Ilmu data, Anda dapat memilih profil pekerjaan Anda dari banyak pilihan, dan sebagian besar pekerjaan ini dibayar dengan baik. Beberapa dari profil pekerjaan ini adalah Analis Data, Ilmuwan Data, Insinyur Data, Ilmuwan dan Insinyur Pembelajaran Mesin, Pengembang Intelijen Bisnis, Arsitek Data, Ahli Statistik, dll.

Apa perbedaan data nominal dengan data ordinal?

Data nominal mencakup nama atau karakteristik yang mengandung dua atau lebih kategori, dan kategori tersebut tidak memiliki urutan bawaan. Dengan kata lain, jenis data ini tidak memiliki peringkat atau urutan alami. Tipe data ordinal mirip dengan tipe nominal, tetapi perbedaan antara keduanya adalah urutan yang jelas dalam data. Secara keseluruhan, data ordinal memiliki beberapa urutan, tetapi data nominal tidak. Semua data peringkat, seperti skala Likert, skala tinja Bristol, dan skala lainnya yang diberi peringkat antara 0 dan 10, dapat diekspresikan dengan menggunakan data ordinal.