علماء البيانات: الأساطير مقابل الحقائق
نشرت: 2018-04-05أي شيء يكتسب زخمًا سريعًا يميل إلى أن يصبح ما يتحدث عنه الجميع. وكلما زاد عدد الأشخاص الذين يتحدثون عن شيء ما ، تتراكم المفاهيم الخاطئة والأساطير. علم البيانات والتحليلات هو أحد هذه المجالات التي تتزايد باستمرار ، ومعها ، هناك عدد متزايد من الخرافات المرتبطة بها.
اليوم ، سنقوم بكشف زيف بعض هذه الخرافات والمفاهيم الخاطئة التي تدور حول حياة وعمل علماء البيانات. ولكن قبل أن ننتقل إلى ذلك ، دعونا أولاً نفهم يومًا نموذجيًا في حياة عالم البيانات.
لدى المؤسسة أكوام من البيانات التي جمعوها بمرور الوقت من مصادر مختلفة وبتنسيقات مختلفة. الآن ، قرروا أن يفعلوا شيئًا حيال ذلك. يريدون الاستفادة من بياناتهم. إلى من يلجأون؟
علماء البيانات!
نعم ، علماء البيانات الذين يخلطهم معظمهم بأنهم كائنات خارقة للطبيعة. هؤلاء الأشخاص هم قلب وروح فريق تحليلات البيانات في أي مؤسسة. يشغلون منصبًا حيويًا وعلى الرغم من أنه قد يكون مفاجأة لك ، إلا أن يومهم المعتاد يشبه تمامًا اليوم المعتاد لأي موظف آخر من ذوي الياقات البيضاء.
جدول المحتويات
الاجتماعات والاجتماعات وبعض الاجتماعات الأخرى!
يتعين على علماء البيانات حضور الاجتماعات ، على أساس يومي في الغالب ، لجمع المتطلبات ومناقشة العمل المنجز والتخطيط لعمل اليوم. هناك أيضًا اجتماعات داخلية مهمة للأهداف التنظيمية والتغلب على مشاكل العمل. بشكل عام ، الغرض من هذه الاجتماعات هو الحصول على فكرة أوضح عن المشاكل المطروحة والتأكد من أن كل فرد في المنظمة من حيث الطريق إلى الأمام.
استعد للبيانات واجعلها أصلية!
يذهب جزء من يومهم إلى تحديد مشكلات العالم الحقيقي التي تواجهها مؤسستهم واكتشاف طرق لجعل بياناتهم تساعد في حل تلك المشكلات. ثم يأتي الجزء الأكثر صعوبة - تحديد نوع ومصدر البيانات المطلوبة. دائمًا ما يختار عالم البيانات المتمرس البيانات من أكثر المصادر ذات الصلة - تلك التي من المحتمل أن تقدم قيمة.
ومع ذلك ، هذا شيء يأتي مع الخبرة والخبرة. ومن ثم ، يحتاج علماء البيانات إلى قضاء الكثير من الوقت في ذلك.
ومع ذلك ، فإن جمع البيانات لا يؤدي إلا إلى نصف المهمة. يحتاج عالم البيانات أيضًا إلى التأكد من التحقق من صحة البيانات وتنظيفها. إذا عملوا مع بيانات غير كاملة ، فإن فرص النجاح تتناقص بشكل كبير.
أساسيات الإحصاء الأساسية لعلوم البياناتاحصل على عمل السحر. نعني التحليلات.
عندما يتم تنظيف البيانات بالكامل ، يقضي عالم البيانات وقته المتبقي في تحديد الاتجاهات والأنماط من البيانات. هذا جانب إشكالي آخر في وظيفة عالم البيانات ، خاصةً أنه لا توجد طريقة محددة لتحليل هذه البيانات بكفاءة. في كثير من الأحيان ، يتطلب الأمر من عالم بيانات تصميم أدواتهم وخوارزمياتهم أو تعديلها باستخدام الأدوات الموجودة. هذا يتطلب عقلًا متفتحًا واستعدادًا للتجربة.
نسج قصة.
بعد تحليل مجموعات البيانات ، يأتي الجزء الأكثر أهمية - وهو تصور البيانات. يحتاج علماء البيانات إلى تقديم النتائج التي توصلوا إليها أمام جمهور غير تقني في الغالب ، مثل أصحاب المصلحة والمسوقين في الشركة. هذه ليست مهمة يومية دائمًا ، ولكن يجب القيام بها بشكل متكرر لإبقاء الأمور في حالة حركة. يتضمن عبء العمل الكبير لعالم البيانات هنا الخروج بتقنية تصور لا تلتقط جوهر بياناتهم فحسب ، بل تقدم أيضًا كل شيء بطريقة مبهجة من الناحية الجمالية.
دور عالم البيانات ديناميكي للغاية ؛ لا يوجد يومان متماثلان بالنسبة لهم. وظيفتهم تنطوي على أن يكونوا على أصابع قدمهم وأن يكونوا دائمًا على رؤوسهم. البيانات التي يعملون معها ، والمشكلات التي يهدفون إلى حلها ، والرؤى التي يتطلعون إلى اكتشافها ، كلها تتغير باستمرار. هذا ما يجعل دور عالم البيانات فريدًا ومثيرًا.
دليل المبتدئين لعلوم البيانات وتطبيقاتهاالآن ، اتخذ خطوة للأمام وافضح المزيد من هذه الأساطير ، والتي تكون أحيانًا غير معقولة ، مثل: الفيديو

فيديو يوتيوب
الخرافة الأولى: يجب أن تكون خبيرًا في الإحصاء وحاصلًا على درجة الدكتوراه. في الإحصاء. أو ، على الأقل ، يجب أن يكون لديك شهادة في الإحصاء.
نعم ، سيضمن حصولك على درجة علمية رسمية في الإحصاء أنك تتعامل مع أفضل الممارسات في الإحصاء من اليوم الأول. ومع ذلك ، احتفظ بخيولك هناك - إذا نظرت إلى عالم علم البيانات ، ستجد المزيد من الأشخاص من خلفية إدارية / غير رياضية من "علماء الصواريخ" المدمنين على الرياضيات.
الخرافة الثانية: يجب أن تكون مبرمجًا متشددًا لتتفوق في علم البيانات. الأكثر فظاظة ، كان ذلك أفضل.
مرة أخرى ، مثل الأسطورة التي ناقشناها قبل سطرين فقط ، يعتمد هذا أيضًا على افتراض خاطئ حول وظيفة عالم البيانات. يفترض الناس أن كونهم عالم بيانات يتضمن كتابة سطور من الرموز والخوارزميات وما إلى ذلك! ولكن ، إذا انتبهت إلى الروتين الذي ناقشناه سابقًا ، فسوف تدرك أنه لا يوجد "ترميز" مهم هناك. تتوفر معظم الخوارزميات أو الطرق الجاهزة مع القليل من التغيير والتبديل. ومع ذلك ، يجب أن يكون لديك عقل منطقي للقيام بذلك.
ابدأ في علوم البيانات مع بايثونالخرافة رقم 3: علماء البيانات ليسوا علماء بأي معنى للكلمة.
كل عالم افتراضيًا هو عالم بيانات. لطالما تعايشت العلوم البحتة مع بيانات المراقبة. بدون القدرة على غربلة بياناتهم وفرزها وتنظيمها وتصنيفها وتنظيرها وتقديمها ، لا يمكن لأي عالم أن يحقق الاتساق في دراستهم. وبالمثل ، فإن عالم البيانات الذي لم يتعمق في قلب بياناته لا يمكنه تقديم نتائجهم بفعالية. لطالما كانت الضوابط الإحصائية حجر الأساس للعلوم البحتة ، وهي الآن المسؤوليات الأساسية لعالم البيانات. لذا ، إذا كان عالم البيانات يراقب الاتجاهات والأنماط في سلوك عملاء المنظمة ، ويؤكد النتائج التي توصلوا إليها باستخدام الإحصائيات والتجارب الواقعية ، فهم عالِمون ، بكل بساطة وبساطة.
الخرافة الرابعة: علماء البيانات يعملون على أدوات إحصائية مكلفة ومعقدة لإنجاز عملهم.
بشكل أساسي ، تتطلب وظيفة عالم البيانات منهم البحث عن الاتجاهات والأنماط المخفية في مجموعة واسعة من البيانات. لذلك ، يمكنهم استخدام أدوات التصور سهلة الاستخدام ، أو أدوات ذكاء الأعمال المدفوعة بالخدمة الذاتية ، أو أدوات استكشاف البيانات التفاعلية ، أو حتى الأدوات البسيطة التي لا تتطلب إتقانًا إحصائيًا كبيرًا. فقط للإضافة ، يمكن للعديد من محللي الأعمال في العالم العثور على رؤى عميقة حتى من نمذجة الميزات في تطبيق جداول البيانات الأساسي.
الأسطورة رقم 5: علم البيانات هو كل شيء عن تغذية البيانات في مجموعات Hadoop واستخدام MapReduce. بسيط!
إذا حاول الناس الاستكشاف قبل نشر الأساطير ، فلن نكون هنا. إذا تحدثت إلى عالم بيانات ، فسوف تدرك أن هناك الكثير لعلوم البيانات والتحليلات أكثر من Hadoop و MapReduce. هذان هما فقط اثنان من العديد من الأدوات. في أغلب الأحيان ، يستخدم مشروع علم البيانات الناجح مجموعة من الأدوات في مراحل مختلفة. ومن ثم ، من المتوقع أن يكون عالم البيانات على رأس أي تطورات تكنولوجية كبرى تحدث في هذا المجال لإجراء التبديل المناسب إلى أي أداة أو تقنية كلما دعت الحاجة. عندما يتعلق الأمر بعلم البيانات ، فإن الحذاء الواحد لا يناسب الجميع ، ولا توجد لوحة ويجا سحرية تجعل أرواح علوم البيانات تتحدث إلينا كبشر.
أهم الخطوات لإتقان علوم البيانات ، ثق بي لقد جربتهانأمل أن تستمتع بتوسيع رؤيتك! ابق معنا. سنعود مع المزيد من Mythbusters.
هل دكتوراه. إلزامي لتصبح عالم بيانات؟
دعنا نقسم دور عالم البيانات إلى مجالين لفهم هذا بشكل أفضل:
1. دور علوم البيانات التطبيقية - يعتبر العمل مع الخوارزميات الحالية وفهم كيفية عملها هو المحور الرئيسي لعلوم البيانات التطبيقية. بعبارة أخرى ، يتعلق الأمر برمته بدمج هذه الأساليب في مشروعك. غالبية الأشخاص المرتبطين بمهنة علوم البيانات يندرجون تحت هذه الفئة. عادة ما يتم مشاهدة معظم الوظائف الشاغرة والأوصاف الوظيفية لهذا الدور.
2. دور البحث - إذا كنت مهتمًا بدور البحث ، فقد تحتاج إلى شهادة دكتوراه. يتضمن دور البحث في علوم البيانات إنشاء خوارزميات جديدة من البداية ، والبحث عنها ، وكتابة الأوراق العلمية ، وما إلى ذلك.
هل سيحل الذكاء الاصطناعي محل علماء البيانات في المستقبل القريب؟
في تطور علم البيانات ، من المعقول أن نقول إن الذكاء الاصطناعي سيحل في النهاية محل العمليات التي يقوم بها علماء البيانات يدويًا. ومع ذلك ، لا يمكن للكمبيوتر أن يقرر بنفسه ما إذا كان سينظف البيانات ، أو يطور نموذجًا فعالاً ، أو يعمل على صحة النموذج ، وما إلى ذلك. يتم اتخاذ هذه الاختيارات من قبل شخص لديه المؤهلات اللازمة. حتى إذا كانت هناك محاولات لتطوير خوارزميات أكثر تقدمًا على أمل تقليل الحاجة إلى علماء البيانات ، فمن غير المرجح أن يحدث هذا قريبًا. حتى مع الخوارزميات الأكثر تقدمًا ، فإن الحفاظ على عمل الشركات لا يزال يتطلب شخصًا يتمتع بحكم سليم ومعرفة بالمجال.
هل يمكنني أن أصبح عالم بيانات بمجرد إتقان أدوات علوم البيانات؟
من المفاهيم الخاطئة الشائعة أن معرفة كيفية استخدام المكتبات والأدوات الإحصائية يؤهلك لأن تكون عالم بيانات. سيساعدك العمل باستخدام هذه الأدوات على فهمها بشكل أفضل ، لكن علم البيانات هو مجموعة مهارات تجمع بين مجموعة متنوعة من القدرات. يعد التعرف على الأدوات التي تتوافق معها جانبًا واحدًا فقط من العملية. إلى جانب معرفة الأدوات مثل Python أو R ، فإن المهارات مثل حل المشكلات ، والفهم الشامل للمفاهيم ، والمعلومات حول التطبيقات الصحيحة اللازمة لمشكلة العمل هي أيضًا ضرورية لإتقانها.