Apa yang membuat Postingan “Ilmu Data” Populer di Medium?

Diterbitkan: 2018-10-18

Blog ini awalnya diterbitkan di Medium oleh Aiswarya Ramachandran – alumnus program Ilmu Data UpGrad dengan IIIT-Bangalore.

Di salah satu posting saya sebelumnya di Medium, saya telah menulis tentang cara mengikis hasil pencarian untuk string kueri tertentu dari Medium. Dalam posting ini, kita akan membahas detail menganalisis data yang dihapus untuk istilah pencarian "Ilmu Data" untuk mengelompokkan posting berdasarkan Jumlah tepukan dan Tanggapan ke dalam berbagai tingkat popularitas dan juga memahami apa yang membuat posting ini populer.

Data yang dihapus dari hasil pencarian Medium adalah file JSON dengan data ekstensif tentang setiap hasil pencarian. Untuk menjelajahi struktur file JSON, saya menggunakan Notepad++ dengan plugin JSON. File JSON memiliki data tentang postingan, penulis postingan, dan penerbit yang terkait dengan postingan tersebut (jika ada). Berikut struktur data JSON untuk postingan sedang:

Kode untuk mengekstrak data dari file JSON dapat ditemukan di sini. Selain mengekstrak data dari file JSON, saya juga menambahkan kolom dengan tanggal saat postingan dihapus.

Ilmu Data Diringkas Dalam Satu Gambar

Daftar isi

Analisis Eksplorasi Postingan Terkait “Ilmu Data”

Pada hasil scraping untuk istilah pencarian "Ilmu Data", 831 postingan dihapus, 31 di antaranya merupakan tanggapan terhadap postingan dan dikeluarkan dari analisis. Berikut adalah jumlah posting yang diterbitkan selama bertahun-tahun, data yang dihapus dari Maret 2013 hingga April 2018:

Semua bidang tanggal seperti Tanggal Dibuat, Tanggal Penerbitan Pertama, Tanggal Pembaruan Terakhir di mana milidetik telah berlalu sejak Jan 1970. Mereka diubah menjadi format tanggal yang dapat dibaca manusia menggunakan fungsi di bawah ini

 # Fungsi untuk Mengonversi Tanggal EPOCH ke format yang Dapat Dibaca Manusia
 def convertToDateString(tanggal):
    kembali (datetime(1970, 1, 1) + timedelta(milidetik=tanggal)).strftime("%Y-%m-%d %H:%M:%S")

Langkah selanjutnya adalah melihat kata-kata apa yang paling sering muncul di judul posting ini. Seperti yang Anda lihat dari kata cloud di bawah ini, Data Science, Big Data, AI, Analytics, Machine Learning, Python, self-driven (tentang mobil self-driving) adalah beberapa kata yang paling sering muncul.

Distribusi Jumlah Tepuk Tangan, Jumlah Tanggapan sangat miring. 708 posting memiliki kurang dari 500 tepukan. Ini menunjukkan bahwa ada beberapa posting yang menjadi populer. Berikut pembagian tepuk tangan:

Waktu Membaca (menit) dari sebagian besar artikel adalah antara 1 hingga 3 menit.

Di Medium, setiap posting dapat memiliki maksimal 5 tag. Tag membantu pembaca menemukan konten dengan lebih mudah. Semakin banyak tag yang relevan, semakin mudah ditemukan. Seperti yang dapat kita lihat pada gambar, Data Science adalah tag yang paling sering digunakan, diikuti oleh Machine Learning, Big data, Artificial Intelligence. Berikut adalah 10 tag teratas yang terkait dengan ilmu data:


Mengapa Pekerjaan Ilmu Data dalam Permintaan Tinggi?

Membuat Cluster Berdasarkan Respons Pengguna

Ada tiga metrik untuk mengukur seberapa populer sebuah postingan di Medium yaitu. #Tepuk tangan, #Respon dan #Rekomendasi. Untuk membuat perbandingan yang adil, saya juga menyertakan fitur #Hari antara Penerbitan Pertama dan tanggal pengumpulan data. Pada set fitur ini, saya menerapkan k-means clustering dan mengidentifikasi tiga cluster. Seperti yang dapat kita lihat dari gambar di bawah, ada perbedaan besar antara tiga metrik di seluruh cluster (Grup Popularitas). Juga, kita dapat melihat bahwa untuk posting yang kurang populer meskipun hari-hari rata-rata mereka antara penerbitan dan penghapusan adalah yang tertinggi, keterlibatan mereka sangat rendah. Berikut adalah metrik di seluruh cluster (Grup Popularitas):

Memahami Apa yang Membuat Postingan Ilmu Data Populer

Seperti yang bisa kita lihat dari gambar di bawah, untuk artikel yang lebih populer median untuk artikel dengan popularitas tinggi dan sedang adalah 9 dan 7. Mereka juga memiliki lebih banyak tautan dibandingkan dengan artikel yang kurang populer. Ini berarti bahwa kiriman Populer merujuk ke kiriman lain dan sumber informasi lain yang menambah nilai lebih pada konten. Perbedaan antara Postingan Populer dan Tidak Populer

Dari gambar di atas, kita juga dapat melihat bahwa postingan dengan popularitas sedang lebih dekat dengan grup yang sangat populer daripada grup yang kurang populer.

Aplikasi Ilmu Data dan Pembelajaran Mesin di NETFLIX

Dengan k-means sederhana, kami dapat mengidentifikasi postingan populer dan tidak populer di Medium terkait Ilmu Data.

Pelajari kursus ilmu data dari Universitas top dunia. Dapatkan Program PG Eksekutif, Program Sertifikat Tingkat Lanjut, atau Program Magister untuk mempercepat karier Anda.

Ketika berbicara tentang Medium, seberapa sering Anda harus memposting?

Jika Anda ingin sukses di Medium dan tidak dapat memposting setiap hari, setidaknya tulis 3 hingga 5 kali setiap minggu. Konsistensi adalah hal terpenting yang harus Anda perjuangkan. Apa pun jadwal yang Anda buat, pastikan itu berkelanjutan dalam jangka panjang dan patuhi itu.

Apakah mungkin bagi siapa saja untuk dipublikasikan di Medium?

Siapa pun dapat membuat akun Medium gratis dan langsung mulai ngeblog. Penulis dapat mengirimkan karya mandiri, berkontribusi pada koleksi cerita yang dikumpulkan, atau membuat koleksi mereka sendiri. Dengan editor sederhana mereka, Anda dapat berbagi pengalaman Anda dengan dunia sebagai penulis Medium. Penerbitan di Medium benar-benar gratis, dan cerita Anda akan dibagikan dengan pengikut Anda serta jutaan orang lain yang tertarik dengan tema serupa.

Di Medium, Apa Itu Menuju Ilmu Data?

Perusahaan, Towards Data Science Inc., berbasis di Kanada. Mereka menggunakan Medium untuk membuat forum bagi ribuan individu untuk berbagi ide dan mempelajari lebih lanjut tentang ilmu data. Penulis dapat memilih untuk membatasi akses ke postingan mereka kepada anggota secara eksklusif sebagai bagian dari ekosistem Medium. Melalui Program Mitra Menengah, Anda dapat menjangkau audiens yang lebih besar dan menghasilkan uang dengan menerbitkan di Towards Data Science. Sesuai dengan Persyaratan Layanan Medium, yang Anda setujui saat membuat akun Medium, Anda juga adalah pemilik tunggal dari karya Anda.