ما الذي يجعل منشور "علوم البيانات" رائجًا على الوسيط؟

نشرت: 2018-10-18

تم نشر هذه المدونة في الأصل على موقع Medium بواسطة Aiswarya Ramachandran - خريجة برنامج UpGrad's Data Science مع IIIT-Bangalore.

في إحدى منشوراتي السابقة على "المتوسط" ، كنت قد كتبت عن كيفية كشط نتائج البحث لسلسلة استعلام معينة من "الوسيط". في هذا المنشور ، سنخوض في تفاصيل تحليل البيانات التي تم إلغاؤها لمصطلح البحث "Data Science" لتجميع المنشورات بناءً على عدد التصفيقات والردود في مستويات مختلفة من الشعبية وأيضًا فهم ما يجعل هذه المنشورات شائعة.

كانت البيانات التي تم إلغاؤها من نتائج البحث المتوسطة عبارة عن ملف JSON مع بيانات شاملة حول كل نتيجة بحث. لاستكشاف بنية ملف JSON ، استخدمت Notepad ++ مع المكون الإضافي JSON. يحتوي ملف JSON على بيانات حول المنشورات ومؤلف المنشور والناشر المرتبط بهذه المشاركة (إن وجدت). إليك بنية بيانات JSON لمنشور متوسط:

يمكن العثور على الكود الخاص باستخراج البيانات من ملف JSON هنا. بالإضافة إلى استخراج البيانات من ملف JSON ، أضفت أيضًا حقلاً بتاريخ إلغاء المنشور.

تلخيص علم البيانات في صورة واحدة

جدول المحتويات

تحليل استكشافي للوظائف المتعلقة بـ "علم البيانات"

عند كشط نتائج مصطلح البحث "Data Science" ، تم إلغاء 831 مشاركة ، من بينها 31 كانت عبارة عن ردود على مشاركة وتم استبعادها من التحليل. فيما يلي عدد المنشورات التي تم نشرها على مدار سنوات ، كانت البيانات التي تم إلغاؤها من مارس 2013 إلى أبريل 2018:

جميع حقول التاريخ مثل تاريخ الإنشاء ، تاريخ النشر الأول ، تاريخ آخر تحديث حيث انقضت ميلي ثانية منذ يناير 1970. تم تحويلها إلى تنسيق تاريخ يمكن قراءته بواسطة الإنسان باستخدام الوظيفة أدناه

 # وظيفة لتحويل تاريخ EPOCH إلى تنسيق يمكن قراءته من قبل الإنسان
 def convertToDateString (التاريخ):
    return (datetime (1970، 1، 1) + timedelta (milliseconds = date)). strftime ("٪ Y-٪ m-٪ d٪ H:٪ M:٪ S")

كانت الخطوة التالية هي إلقاء نظرة على الكلمات الأكثر شيوعًا في عناوين هذه المنشورات. كما ترون من الكلمة السحابية أدناه ، فإن Data Science ، Big Data ، AI ، Analytics ، Machine Learning ، Python ، ذاتية القيادة (حول السيارات ذاتية القيادة) هي بعض الكلمات الأكثر شيوعًا.

توزيع عدد التصفيقات ، عدد الاستجابات منحرف للغاية. تحتوي 708 مشاركة على أقل من 500 تصفيق. هذا يدل على أن هناك عددًا قليلاً من المنشورات التي أصبحت شائعة. هنا توزيع التصفيق:

يتراوح وقت القراءة (بالدقائق) لمعظم المقالات ما بين 1 إلى 3 دقائق.

في المتوسط ​​، يمكن أن تحتوي كل مشاركة على 5 علامات كحد أقصى. تساعد العلامات القراء في العثور على المحتوى بسهولة أكبر. كلما كانت العلامات أكثر صلة ، كان العثور عليها أسهل. كما نرى في الصورة ، فإن Data Science هي العلامة الأكثر استخدامًا ، يليها التعلم الآلي ، والبيانات الضخمة ، والذكاء الاصطناعي. فيما يلي أهم 10 علامات متعلقة بعلوم البيانات:


لماذا وظائف علوم البيانات في ارتفاع الطلب؟

إنشاء مجموعات بناءً على استجابات المستخدم

هناك ثلاثة مقاييس لقياس مدى شهرة المنشور على موقع Medium. # تصفيق ، # استجابات و # توصيات. لإجراء مقارنة عادلة ، قمت أيضًا بتضمين الميزة # الأيام بين تاريخ النشر الأول وتاريخ جمع البيانات. في مجموعة الميزات هذه ، قمت بتطبيق مجموعات k-mean وحددت ثلاث مجموعات. كما نرى من الصورة أدناه ، هناك فرق كبير بين المقاييس الثلاثة عبر المجموعات (مجموعات الشعبية). أيضًا ، يمكننا أن نرى أنه بالنسبة للمنشورات الأقل شيوعًا ، على الرغم من أن متوسط ​​أيامها بين النشر والإلغاء هو أعلى نسبة مشاركة منخفضة جدًا. فيما يلي المقاييس عبر المجموعات (مجموعات الشعبية):

فهم ما يجعل منشور علم البيانات رائجًا

كما نرى من الصورة أدناه ، بالنسبة للمقالات الأكثر شيوعًا ، يكون متوسط ​​المقالات ذات الشعبية العالية والمتوسطة هو 9 و 7. كما أن لديهم أيضًا روابط أكثر مقارنة بالمقالات الأقل شهرة. هذا يعني أن المشاركات الشائعة تشير إلى المنشورات الأخرى ومصادر المعلومات الأخرى التي تضيف قيمة أكبر إلى المحتوى. الفرق بين المشاركات الشعبية وغير الشعبية

من الصورة أعلاه ، يمكننا أيضًا أن نرى أن المنشور الذي يتمتع بشعبية متوسطة يكون أقرب إلى مجموعة شائعة جدًا منه إلى المجموعة الأقل شهرة.

تطبيقات علوم البيانات والتعلم الآلي في NETFLIX

باستخدام وسيلة k بسيطة ، تمكنا من تحديد المشاركات الشائعة وغير الشائعة على الوسيط المتعلق بعلوم البيانات.

تعلم دورات علوم البيانات من أفضل الجامعات في العالم. اربح برامج PG التنفيذية أو برامج الشهادات المتقدمة أو برامج الماجستير لتتبع حياتك المهنية بشكل سريع.

عندما يتعلق الأمر بـ Medium ، كم مرة يجب أن تنشر؟

إذا كنت تريد أن تكون ناجحًا على Medium ولا يمكنك النشر يوميًا ، اكتب على الأقل من 3 إلى 5 مرات كل أسبوع. الاتساق هو أهم شيء يجب أن تسعى إليه. مهما كان الجدول الزمني الذي توصلت إليه ، تأكد من أنه مستدام على المدى الطويل والتزم به.

هل يمكن لأي شخص أن ينشر على ميديوم؟

يمكن لأي شخص إنشاء حساب متوسط ​​مجاني والبدء في التدوين على الفور. يمكن للكتاب إرسال قطع مستقلة أو المساهمة في مجموعات القصص المجمعة أو إنشاء مجموعاتهم الخاصة. باستخدام محررهم البسيط ، يمكنك مشاركة تجاربك مع العالم ككاتب متوسط. النشر على Medium مجاني تمامًا ، وستتم مشاركة قصصك مع متابعيك بالإضافة إلى ملايين الأشخاص الآخرين المهتمين بمواضيع مماثلة.

على المتوسط ​​، ما هو نحو علم البيانات؟

يقع مقر الشركة ، Towards Data Science Inc. ، في كندا. يستخدمون Medium لإنشاء منتدى لآلاف الأفراد لمشاركة الأفكار ومعرفة المزيد حول علم البيانات. يمكن للمؤلفين اختيار تقييد الوصول إلى مشاركاتهم على الأعضاء حصريًا كجزء من النظام البيئي المتوسط. من خلال برنامج الشريك المتوسط ​​، يمكنك الوصول إلى جمهور أكبر وكسب المال عن طريق النشر في نحو علوم البيانات. تماشياً مع شروط خدمة Medium ، التي توافق عليها عند إنشاء حساب على موقع Medium ، فأنت أيضًا المالك الوحيد لعملك.