Bir "Veri Bilimi" Gönderisini Medium'da Popüler yapan nedir?

Yayınlanan: 2018-10-18

Bu blog ilk olarak, UpGrad'ın IIIT-Bangalore ile Veri Bilimi programının bir mezunu olan Aiswarya Ramachandran tarafından Medium'da yayınlandı.

Medium'daki önceki yazılarımdan birinde, Medium'dan belirli bir sorgu dizesi için arama sonuçlarının nasıl kazınacağı hakkında yazmıştım. Bu gönderide, Alkış ve Yanıt Sayısına göre gönderileri farklı popülerlik seviyelerine göre gruplamak için "Veri Bilimi" arama terimi için hurdaya çıkarılan verileri analiz etmenin ayrıntılarına gireceğiz ve ayrıca bu gönderileri neyin popüler kıldığını anlayacağız.

Orta arama sonuçlarından çıkarılan veriler, her arama sonucu hakkında kapsamlı veriler içeren JSON dosyasıydı. JSON dosyasının yapısını keşfetmek için JSON eklentisi ile Notepad++ kullandım. JSON dosyası, gönderiler, gönderinin yazarı ve bu gönderiyle (varsa) ilişkili yayıncı hakkında veriler içeriyordu. Orta boy bir gönderi için JSON veri yapısı:

JSON dosyasından veri çıkarma kodu burada bulunabilir. JSON dosyasından veri çıkarmaya ek olarak, gönderinin rafa kaldırıldığı tarihi içeren bir alan da ekledim.

Tek Resimde Özetlenen Veri Bilimi

İçindekiler

“Veri Bilimi” İle İlgili Gönderilerin Keşifsel Analizi

"Veri Bilimi" arama terimi için kazıma sonuçlarında, 31'i bir gönderiye yanıt olan 831 gönderi silindi ve analizden çıkarıldı. İşte yıllar içinde yayınlanan yayınların sayısı, hurdaya çıkarılan veriler Mart 2013'ten Nisan 2018'e kadardı:

Oluşturma Tarihi, İlk Yayınlanma Tarihi, Son Güncelleme Tarihi gibi milisaniyelerin Ocak 1970'den beri geçtiği tüm tarih alanları. Aşağıdaki fonksiyon kullanılarak insan tarafından okunabilir bir tarih formatına dönüştürüldüler.

 # EPOCH Tarihini Okunabilir Formata Dönüştürme Fonksiyonu
 def convertToDateString(tarih):
    dönüş (datetime(1970, 1, 1) + timedelta(milisaniye=tarih)).strftime("%Y-%m-%d %H:%M:%S")

Bir sonraki adım, bu gönderilerin başlıklarında en çok hangi kelimelerin geçtiğine bakmaktı. Aşağıdaki kelime bulutundan da görebileceğiniz gibi, Data Science, Big Data, AI, Analytics, Machine Learning, Python, self-driven (kendi kendini süren arabalar hakkında) en sık kullanılan kelimelerden bazılarıdır.

Alkış Sayısı, Yanıt Sayısı dağılımı oldukça çarpık. 708 gönderi 500'den az alkış aldı. Bu, popüler hale gelen birkaç gönderi olduğunu gösterir. İşte alkışların dağılımı:

Çoğu makalenin Okuma Süresi (dakika) 1 ila 3 dakika arasındadır.

Medium'da her gönderide en fazla 5 etiket olabilir. Etiketler, okuyucuların içeriği daha kolay bulmasına yardımcı olur. Daha alakalı etiketler, bulmak daha kolay. Görselde de görebileceğimiz gibi Data Science en sık kullanılan etiket olurken, bunu Makine Öğrenimi, Büyük Veri, Yapay Zeka takip ediyor. İşte veri bilimi ile ilgili en iyi 10 etiket:


Veri Bilimi İşlerine Neden Yüksek Talep Var?

Kullanıcı Yanıtlarına Dayalı Kümeler Oluşturma

Medium'da bir gönderinin ne kadar popüler olduğunu ölçmek için üç ölçüm vardır. #Alkışlar, #Yanıtlar ve #Tavsiyeler. Adil bir karşılaştırma yapmak için, İlk Yayınlanma tarihi ile veri toplama tarihi arasındaki #Günler özelliğini de ekledim. Bu özellik setinde k-ortalamalar kümeleme uyguladım ve üç küme belirledim. Aşağıdaki resimden de görebileceğimiz gibi, kümeler arasındaki üç ölçüm (Popülerlik Grupları) arasında büyük bir fark vardır. Ayrıca, daha az popüler olan gönderilerin, yayınlama ve iptal etme arasındaki medyan günlerinin en yüksek olmasına rağmen etkileşimlerinin çok düşük olduğunu görebiliriz. Kümeler arasındaki metrikler (Popülarite Grupları):

Bir Veri Bilimi Gönderisini Neyin Popüler Kıldığını Anlamak

Aşağıdaki resimden de görebileceğimiz gibi, daha popüler makaleler için yüksek ve orta popülerlik makalelerinin medyanı 9 ve 7'dir. Ayrıca daha az popüler makalelere kıyasla daha fazla bağlantıya sahiptirler. Bu, Popüler gönderilerin içeriğe daha fazla değer katan diğer gönderilere ve diğer bilgi kaynaklarına atıfta bulunduğu anlamına gelir. Popüler ve Popüler Olmayan Gönderiler Arasındaki Fark

Yukarıdaki resimden, orta düzeyde popülerliğe sahip gönderinin, daha az popüler olan bir gruba göre oldukça popüler bir gruba daha yakın olduğunu görebiliriz.

NETFLIX'te Veri Bilimi ve Makine Öğrenimi Uygulamaları

Basit bir k-means ile, Veri Bilimi ile ilgili Medium'daki popüler ve popüler olmayan gönderileri belirleyebildik.

Dünyanın en iyi Üniversitelerinden veri bilimi derslerini öğrenin . Kariyerinizi hızlandırmak için Yönetici PG Programları, Gelişmiş Sertifika Programları veya Yüksek Lisans Programları kazanın.

Medium söz konusu olduğunda, ne sıklıkla gönderi paylaşmalısınız?

Medium'da başarılı olmak istiyor ve her gün paylaşım yapamıyorsanız, haftada en az 3 ila 5 kez yazın. Tutarlılık, çabalamanız gereken en önemli şeydir. Hangi takvime sahip olursanız olun, bunun uzun vadede sürdürülebilir olduğundan emin olun ve ona bağlı kalın.

Medium'da herkesin yayın yapması mümkün mü?

Herkes ücretsiz bir Medium hesabı oluşturabilir ve hemen blog yazmaya başlayabilir. Yazarlar bağımsız parçalar gönderebilir, toplanan hikaye koleksiyonlarına katkıda bulunabilir veya kendi koleksiyonlarını oluşturabilir. Basit editörleri ile, deneyimlerinizi bir Medium yazarı olarak dünyayla paylaşabilirsiniz. Medium'da yayınlamak tamamen ücretsizdir ve hikayeleriniz takipçilerinizle ve benzer temalarla ilgilenen milyonlarca insanla paylaşılacaktır.

Medium'da Veri Bilimine Doğru nedir?

Şirket, Towards Data Science Inc., Kanada merkezlidir. Binlerce kişinin fikirlerini paylaşabileceği ve veri bilimi hakkında daha fazla bilgi edinebileceği bir forum oluşturmak için Medium'u kullanıyorlar. Yazarlar, gönderilerine erişimi yalnızca Medium ekosisteminin bir parçası olarak üyelerle sınırlandırmayı seçebilir. Medium Partner Programı ile daha geniş bir kitleye ulaşabilir ve Towards Data Science'da yayın yaparak para kazanabilirsiniz. Medium hesabı oluştururken kabul ettiğiniz Medium Kullanım Şartları uyarınca, eserinizin de tek sahibi sizsiniz.