Ilmuwan Data: Mitos vs Realitas

Diterbitkan: 2018-04-05

Apa pun yang mendapatkan momentum dengan cepat cenderung menjadi apa yang dibicarakan semua orang. Dan, semakin banyak orang membicarakan sesuatu, semakin banyak kesalahpahaman dan mitos yang menumpuk. Ilmu Data dan Analisis adalah salah satu domain yang terus meningkat, dan dengan itu, semakin banyak mitos terkait.

Hari ini, kita akan menyanggah beberapa mitos dan kesalahpahaman seputar kehidupan dan karya ilmuwan data. Namun sebelum kita beralih ke itu, pertama-tama mari kita pahami hari-hari biasa dalam kehidupan seorang ilmuwan data.

Ilmuwan Data

Sebuah organisasi memiliki banyak data yang telah mereka kumpulkan dari waktu ke waktu dari berbagai sumber dan dalam berbagai format. Sekarang, mereka telah memutuskan untuk melakukan sesuatu tentang hal itu. Mereka ingin membuat data mereka diperhitungkan. Kepada siapa mereka berpaling?

Ilmuwan data!
Ya, para ilmuwan data yang mayoritas disalahartikan sebagai makhluk gaib. Orang-orang ini adalah jantung dan jiwa dari tim analisis data organisasi mana pun. Mereka memegang posisi penting dan meskipun mungkin mengejutkan Anda, hari biasa mereka cukup seperti hari-hari biasa karyawan kerah putih lainnya.

Daftar isi

Rapat, rapat, dan beberapa rapat lagi!

Ilmuwan data harus menghadiri pertemuan, sebagian besar setiap hari, untuk mengumpulkan persyaratan, mendiskusikan pekerjaan yang diselesaikan, dan merencanakan pekerjaan hari itu. Ada juga rapat internal yang penting untuk tujuan organisasi dan mengatasi masalah bisnis. Secara keseluruhan, tujuan dari pertemuan ini adalah untuk mendapatkan gambaran yang lebih jelas tentang masalah yang dihadapi dan memastikan semua orang dalam organisasi mengetahui langkah ke depan.

Mencari data dan membuatnya murni!

Sebagian dari hari mereka digunakan untuk mengidentifikasi masalah dunia nyata yang dihadapi organisasi mereka dan mencari cara untuk membuat data mereka membantu dalam memecahkan masalah tersebut. Kemudian muncul bagian yang lebih menantang – menentukan jenis dan sumber data yang diperlukan. Seorang ilmuwan data yang berpengalaman selalu memilih data dari sumber yang paling relevan – sumber yang kemungkinan besar akan memberikan nilai.

Namun, ini adalah sesuatu yang datang dengan pengalaman dan keahlian. Oleh karena itu, para ilmuwan data perlu menghabiskan cukup banyak waktu untuk itu.

Namun, mengumpulkan data hanya melakukan setengah pekerjaan. Ilmuwan data juga perlu memastikan bahwa data divalidasi dan dibersihkan. Jika mereka bekerja dengan data yang tidak sempurna, peluang untuk berhasil berkurang secara eksponensial.

Dasar-Dasar Dasar Statistik untuk Ilmu Data

Dapatkan untuk melakukan sihir. Maksud kami analitik.

Ketika data sepenuhnya dibersihkan, ilmuwan data menghabiskan sisa waktunya dalam mengidentifikasi tren dan pola dari data. Ini adalah aspek bermasalah lain dari pekerjaan ilmuwan data, terutama karena tidak ada metode yang ditetapkan untuk menganalisis data ini secara efisien. Lebih sering daripada tidak, dibutuhkan seorang ilmuwan data untuk merancang alat dan algoritme mereka atau menyesuaikannya dengan yang sudah ada. Ini menuntut pikiran terbuka dan kemauan untuk bereksperimen.

Merajut sebuah cerita.

Setelah menganalisis kumpulan data, selanjutnya adalah bagian terpenting – yaitu visualisasi data. Ilmuwan data perlu mempresentasikan temuan mereka di depan audiens yang sebagian besar non-teknologi, seperti pemangku kepentingan dan pemasar perusahaan. Ini tidak selalu merupakan tugas harian, tetapi perlu sering dilakukan agar segala sesuatunya tetap berjalan. Beban kerja signifikan ilmuwan data di sini melibatkan pembuatan teknik visualisasi yang tidak hanya menangkap esensi data mereka, tetapi juga menyajikan semuanya dengan cara yang estetis.

Peran seorang ilmuwan data sangat dinamis; tidak ada dua hari yang sama bagi mereka. Pekerjaan mereka melibatkan mereka untuk waspada dan selalu berpikir. Data yang mereka kerjakan, masalah yang ingin mereka pecahkan, dan wawasan yang ingin mereka temukan semuanya terus berubah. Itulah yang membuat peran seorang data scientist begitu unik dan menarik.

Panduan Pemula untuk Ilmu Data dan Aplikasinya

Sekarang, selangkah lebih maju dan singkirkan lebih banyak mitos seperti itu, terkadang tidak masuk akal: video

video Youtube

Mitos #1: Anda harus menjadi ahli statistik dengan gelar Ph.D. dalam statistik. Atau, paling tidak, Anda harus memiliki gelar di bidang statistik.

Ya, memegang gelar formal dalam statistik akan memastikan bahwa Anda sesuai dengan praktik statistik yang lebih baik sejak hari pertama. Namun, pegang kuda Anda di sana – jika Anda melihat dunia ilmu data, Anda akan menemukan lebih banyak orang dari latar belakang manajerial/non-matematika daripada “ilmuwan roket” yang kecanduan matematika.

Mitos #2: Anda harus menjadi programmer hardcore untuk unggul dalam ilmu data. Semakin hardcore, semakin baik.

Sekali lagi, seperti mitos yang kita bahas beberapa baris yang lalu, ini juga didasarkan pada asumsi yang salah tentang pekerjaan ilmuwan data. Orang menganggap menjadi ilmuwan data melibatkan penulisan baris kode dan algoritma dan yang lainnya! Namun, jika Anda memperhatikan rutinitas yang telah kita bahas sebelumnya, Anda akan menyadari bahwa tidak ada "pengkodean" yang signifikan yang terlibat di sana. Sebagian besar algoritma atau metode tersedia siap pakai hanya dengan sedikit penyesuaian yang diperlukan. Namun, Anda harus memiliki pemikiran logis untuk melakukan itu.

Memulai Ilmu Data dengan Python

Mitos #3: Ilmuwan data bukanlah ilmuwan dalam arti kata yang berarti.

Setiap ilmuwan secara default adalah ilmuwan data. Sains murni selalu hidup berdampingan dengan data pengamatan. Tanpa kemampuan untuk menyaring, menyortir, menyusun, mengklasifikasikan, berteori, dan menyajikan data mereka, tidak ada ilmuwan yang dapat membawa koherensi pada studi mereka. Demikian pula, seorang ilmuwan data yang belum menggali jauh ke dalam inti data mereka tidak dapat mempresentasikan temuan mereka secara efektif. Kontrol statistik selalu menjadi landasan sains murni, dan sekarang, itu adalah tanggung jawab mendasar seorang ilmuwan data. Jadi, jika seorang ilmuwan data mengamati tren dan pola dalam perilaku pelanggan organisasi, dan mengkonfirmasi temuan mereka menggunakan statistik dan eksperimen dunia nyata, mereka adalah seorang ilmuwan, polos dan sederhana.

Mitos #4: Ilmuwan data bekerja pada alat statistik yang mahal dan rumit untuk menyelesaikan pekerjaan mereka.

Pada dasarnya, pekerjaan seorang ilmuwan data menuntut mereka untuk mencari tren dan pola tersembunyi dalam kumpulan data yang luas. Untuk itu, mereka dapat menggunakan alat visualisasi yang mudah digunakan, alat intelijen bisnis berbasis pencarian swalayan, alat eksplorasi data interaktif, atau bahkan alat sederhana yang tidak memerlukan banyak penguasaan statistik. Sebagai tambahan, banyak analis bisnis di dunia dapat menemukan wawasan mendalam bahkan dari memodelkan fitur dalam aplikasi spreadsheet utama.

Mitos #5: Ilmu data adalah tentang memasukkan data ke dalam cluster Hadoop dan menggunakan MapReduce. Sederhana!

Jika orang mencoba mengeksplorasi sebelum menyebarkan mitos, kami tidak akan berada di sini. Jika Anda berbicara dengan seorang ilmuwan data, Anda akan menyadari bahwa ada jauh lebih banyak hal dalam ilmu data dan analitik daripada Hadoop dan MapReduce. Keduanya hanyalah dua dari banyak alat. Lebih sering daripada tidak, proyek ilmu data yang sukses menggunakan berbagai alat di berbagai tahap. Oleh karena itu, seorang ilmuwan data diharapkan berada di puncak kemajuan teknologi utama yang terjadi di domain ini untuk melakukan peralihan yang tepat ke alat atau teknologi apa pun kapan pun dibutuhkan. Ketika datang ke Ilmu Data, satu sepatu tidak cocok untuk semua, dan tidak ada papan Ouija ajaib untuk membuat roh ilmu data berbicara kepada kita manusia fana.

Langkah-Langkah Teratas untuk Menguasai Ilmu Data, Percayalah Saya Sudah Mencobanya

Kami harap Anda menikmati memperluas wawasan Anda! Tetap bersama kami; kami akan kembali dengan lebih banyak lagi Mythbusters.

Apakah Ph.D. wajib jadi Data Scientist?

Mari kita uraikan peran seorang Data Scientist menjadi dua area untuk lebih memahami hal ini:

1. Peran Ilmu Data Terapan - Bekerja dengan algoritme terkini dan memahami cara kerjanya adalah fokus utama Ilmu Data Terapan. Dengan kata lain, ini semua tentang menggabungkan metode ini ke dalam proyek Anda. Mayoritas orang yang terkait dengan karir Ilmu Data termasuk dalam kategori ini. Sebagian besar lowongan pekerjaan dan deskripsi pekerjaan biasanya terlihat untuk peran ini.
2. Peran penelitian – Jika Anda tertarik dengan peran Penelitian maka Anda mungkin memerlukan gelar Ph.D. Peran Penelitian dalam Ilmu Data termasuk membuat algoritme baru dari awal, menelitinya, menulis makalah ilmiah, dll.

Akankah Kecerdasan Buatan menggantikan Ilmuwan Data dalam waktu dekat?

Dalam evolusi Ilmu Data, masuk akal untuk mengatakan bahwa kecerdasan buatan pada akhirnya akan menggantikan operasi yang dilakukan oleh Ilmuwan Data secara manual. Namun, komputer tidak dapat memutuskan sendiri apakah akan membersihkan data, mengembangkan model yang efisien, mengerjakan kebenaran model, dan sebagainya. Pilihan ini dibuat oleh seseorang yang memiliki kualifikasi yang diperlukan. Bahkan jika inisiatif sedang dicoba untuk mengembangkan algoritme yang lebih maju dengan harapan dapat mengurangi kebutuhan Ilmuwan Data, hal ini tidak mungkin terjadi dalam waktu dekat. Bahkan dengan algoritme yang paling canggih, menjaga agar perusahaan tetap berfungsi akan tetap membutuhkan seseorang dengan penilaian yang baik dan pengetahuan domain.

Bisakah saya menjadi Ilmuwan Data hanya dengan menguasai alat Ilmu Data?

Ini adalah kesalahpahaman umum bahwa mengetahui bagaimana menggunakan alat statistik dan perpustakaan membuat Anda memenuhi syarat sebagai Ilmuwan Data. Bekerja dengan alat-alat ini akan membantu Anda memahaminya dengan lebih baik, tetapi ilmu data adalah seperangkat keterampilan yang menggabungkan berbagai kemampuan. Mempelajari alat-alat yang menyertainya hanyalah salah satu aspek dari prosesnya. Seiring dengan mengetahui alat seperti Python atau R, keterampilan seperti pemecahan masalah, pemahaman konsep yang menyeluruh, dan informasi tentang aplikasi yang benar yang diperlukan untuk masalah bisnis juga penting untuk dikuasai.