دروس البيانات الضخمة للمبتدئين: كل ما تحتاج إلى معرفته

نشرت: 2018-05-22

تم استحضار البيانات الضخمة ، كمفهوم ، في كل محادثة تقريبًا حول الابتكارات الرقمية وإنترنت الأشياء (IoT) وأبحاث علوم البيانات. ومع ذلك ، لا يزال هناك بعض الالتباس حول ما يعنيه هذا المصطلح بالضبط. في هذا البرنامج التعليمي الخاص بالبيانات الضخمة ، نهدف إلى توضيح كل ما تحتاج إلى معرفته قبل البدء في استخدام البيانات الضخمة.

ببساطة ، البيانات الضخمة هي جمع وتحليل ومعالجة كميات كبيرة من البيانات المتنوعة الناشئة من مصادر متعددة. يمكن لمجموعات البيانات الكبيرة هذه توفير رؤى حول السلوك البشري وإعلام ممارسات الأعمال والاستراتيجيات وتصميم المنتجات والذكاء الاصطناعي والمزيد. في هذا البرنامج التعليمي الخاص بالبيانات الضخمة ، سنرشدك إلى المفاهيم والمصطلحات الأساسية حول الكلمة الطنانة.

شاهد فيديو يوتيوب

نأمل في نهاية هذا البرنامج التعليمي ، أن تكون لديك فكرة كافية لاتخاذ خطواتك الأولى في رحلة البيانات الضخمة. ولكن ، قبل أن ننتقل إلى ذلك في البرنامج التعليمي الخاص بنا حول البيانات الضخمة ، دعنا نرى الفرق بين البيانات الصغيرة والبيانات الضخمة.

البيانات الصغيرة مقابل البيانات الضخمة

من السهل فهم نطاق البيانات الضخمة من خلال المقارنة بالبيانات الصغيرة. البيانات الصغيرة هي معلومات يمكن إدارتها بواسطة جهاز واحد ، أو باستخدام طرق التحليل التقليدية. مصدر وتأثير هذه البيانات على نطاق أصغر. على سبيل المثال ، يمكن استخدام سجلات الإنتاج لتطوير تقارير أداء أسبوعية حول إنتاجية خط التصنيع ؛ أو يمكن استخدام نتائج الاستطلاع في تقرير تسويقي حول تصور العلامة التجارية.

لفهم التمييز الواضح بين نوعي البيانات ، كل ما علينا فعله هو إلقاء نظرة على بعض الإحصاءات - بحلول عام 2020 ، سينشئ كل شخص على وجه الأرض 1.7 ميغابايت من البيانات في الثانية ، مصدرها أكثر من 50 مليار جهاز متصل بالإنترنت. يمكن استخدام هذا الحجم الكبير من البيانات ، من العديد من المصادر تقريبًا ، لإبلاغ قرارات الأعمال للصناعات بأكملها ، وإعادة هيكلة مواقع التجارة الإلكترونية ، وحتى إحداث ثورة في تقديم الرعاية الصحية.

البيانات الضخمة: يجب أن تعرف الأدوات والتقنيات

الآن بعد أن أصبحت لديك فكرة تقريبية عن ماهية البيانات الضخمة ، فلنأخذ هذا البرنامج التعليمي للبيانات الضخمة خطوة إلى الأمام ونتحدث عن المفاهيم الأساسية.

جدول المحتويات

خصائص البيانات الضخمة

كيف تعالج البيانات غير المتجانسة على هذا النطاق الواسع ، حيث تفشل الأساليب التقليدية للتحليل بالتأكيد؟ لقد كان هذا أحد أهم التحديات لعلماء البيانات الضخمة. لتبسيط الإجابة ، قدم دوج لاني ، المحلل الرئيسي لشركة Gartner ، المفاهيم الأساسية الثلاثة لتعريف "البيانات الضخمة".

الصوت

هذا هو التمييز الأساسي عندما يتعلق الأمر بأنظمة البيانات الضخمة. كل واحد منا لديه بصمة رقمية ، وكمية مجموعات البيانات التي يمكن جمعها من كل جهاز من أجهزتنا أمر محير للعقل. خذ Facebook على سبيل المثال - اعتبارًا من عام 2016 ، كان هناك 2.6 تريليون مشاركة على منصة الشبكات الاجتماعية. تويتر يسجل الدخول 500 مليون تغريدة في اليوم. أضف هذا إلى جميع الأجهزة الرقمية الأخرى التي يتصل بها الشخص ، ومن السهل أن تفهم كيف يولد كل إنسان على هذا الكوكب معدل 0.77 جيجابايت من البيانات يوميًا.

السرعة الاتجاهية

تم إنشاء 90٪ من البيانات المتاحة حاليًا في العامين الماضيين فقط. يتم إنشاء 2.5 كوينتيليون بايت من البيانات كل يوم ، ومن المتوقع أن تتم معالجة هذه البيانات في الوقت الفعلي (أو بالقرب من الوقت الفعلي) ، لإنشاء رؤى لن تكون زائدة عن الحاجة في عالم متغير باستمرار. لهذا السبب ابتعد محللو البيانات الضخمة عن النهج التقليدي القائم على الدُفعة ، واعتمدوا التحليل في الوقت الفعلي للتأكد من أنهم يولدون معلومات ذات صلة بالوضع الحالي.

متنوع

ما يجعل أنظمة البيانات الضخمة وثيقة الصلة بالشركات والمجتمعات هو حقيقة أن هذه مجموعات بيانات فريدة ، لأنها تنشأ من مصادر متنوعة ، وتتم معالجتها باستخدام طرق متنوعة. يمكن الحصول على البيانات من موجزات الوسائط الاجتماعية والأجهزة المادية مثل Fitbit وأنظمة أمان المنزل وأنظمة GPS للسيارات والمزيد. البيانات نفسها متنوعة بشكل كبير - فقد تكون وسائط غنية (صور ومقاطع فيديو وتسجيلات صوتية) أو سجلات منظمة وبيانات غير منظمة. تتمثل ميزة USP للبيانات الضخمة في أنها تدمج كل هذه المعلومات ، بغض النظر عن مصدرها ، لتوفير مجموعة بيانات شاملة لكل مستخدم.

تم استخدام Three Vs للتمييز بين البيانات الضخمة منذ عام 2001 ، لكن الروايات الأخيرة تفضل إضافة "الدقة ، والتصور ، والتنوع ، والقيمة" إلى هذه القائمة ، مما يوسع نطاق تحليل البيانات الضخمة إلى أبعد من ذلك.

كان هذا يتعلق بخصائص البيانات الضخمة ، بعد ذلك في هذا البرنامج التعليمي للبيانات الضخمة ، دعنا نتحدث عن كيفية جعل هذه البيانات قابلة للتطبيق واستنباط رؤى منها.

تطبيقات البيانات الضخمة في الثقافة الشعبية

كيف نفهم البيانات الضخمة؟

USP للبيانات الضخمة هو مجموعة متنوعة من الرؤى التي يمكن استخلاصها. عادة لا يمكن القيام بذلك من خلال الأساليب التقليدية ، حيث أن الكثير من الأفكار والاتجاهات والأنماط غالبًا ما تكون غير واضحة. علاوة على ذلك ، لا تتناسب تقنيات تحليل البيانات الصغيرة مع الحجم الكبير والمتنوع للمحتوى الذي يتم إنشاؤه من خلال أساليب البيانات الضخمة.

للتغلب على هذه الحواجز ، تم تطوير العديد من التقنيات الجديدة - أشهرها Apache Hadoop. تستخدم هذه التقنيات الحوسبة العنقودية لاستيعاب المعلومات في نظام البيانات ، وحساب البيانات وتحليلها ، وتصور تدفقات البيانات.

لقد وجدت البيانات الضخمة مكانًا ثابتًا في أي مجال يمكن تخيله وسيكون من الخطأ عدم التحدث عن العجائب التي تقوم بها هذه البيانات الضخمة.

البيانات الضخمة: ما هي وما أهميتها؟

شاهد فيديو يوتيوب
دعنا نختتم هذا البرنامج التعليمي للبيانات الضخمة بالحديث عن تطبيقات البيانات الضخمة:

تطبيقات البيانات الضخمة

  • التنمية الشخصية: على المستوى الفردي ، يتم استخدام البيانات الضخمة لتحسين صحة الفرد. تستخدم Armbands والساعات الذكية بيانات حول دورة النوم واستهلاك السعرات الحرارية ومستويات النشاط والمزيد لتطوير رؤى حول تحسين صحة المستخدم - والتي تغذي المستخدم الفردي بطريقة مخصصة.
  • الإعلان: تستخدم شركات التسويق مجموعة متنوعة من نقاط البيانات ، بما في ذلك نظام تحديد المواقع العالمي (GPS) وأنماط حركة المرور وتتبع حركة العين وما إلى ذلك لتحديد الإعلانات التي يهتم بها الأشخاص أكثر ، وبالتالي تحديد استراتيجية تسويق أكثر دقة. يعد هذا خروجًا عن استراتيجية التسويق التقليدية ، حيث كان السعر "لكل مرة ظهور" للإعلان.
  • تحسين سلسلة التوريد: تلعب البيانات الضخمة دورًا كبيرًا في تحسين مسار التسليم (مصدر قلق كبير لشركات مثل Amazon و eBay) ، حيث يتم تتبع بيانات حركة المرور الحية وسلوك السائق وما إلى ذلك باستخدام معرفات تردد الراديو وأنظمة GPS لتحديد الطريق الصحيح الذي يجب اتخاذه ، اعتمادًا على الوقت من اليوم والسنة.
  • التنبؤ بالطقس: تُستخدم التطبيقات على الهواتف المحمولة لجمع المعلومات حول أنماط الطقس في الوقت الفعلي. باستخدام مجموعة من موازين الحرارة المحيطة والبارومترات ومقاييس الرطوبة ، يمكن لهذه التطبيقات إنشاء بيانات دقيقة في الوقت الفعلي للنماذج التنبؤية ، والتي يمكن أن تحسن بشكل كبير من دقة أنظمة التنبؤ بالطقس.
  • بناء البنية التحتية للمدن الذكية: تقوم المدن بتجربة أنظمة تحليل البيانات الضخمة لتطوير البنية التحتية للمدن الذكية. استخدمت ولاية كاليفورنيا التي تعاني من الجفاف تحليلات البيانات الضخمة لتتبع استخدام المياه من قبل المستهلكين ، مما ساعد على خفض استخدام المياه بنسبة 80٪. خفضت لوس أنجلوس من الازدحام المروري بنسبة 16٪ من خلال مراقبة إشارات المرور حول المدينة.
مهندسو البيانات الضخمة: الخرافات مقابل الحقائق

مع مرور كل عام ، تكبر البيانات الضخمة وتعزز قبضتها على كل مجال. نأمل أن يساعدك هذا البرنامج التعليمي حول البيانات الضخمة في فهم الضجيج الكامن وراء كلمة "البيانات الضخمة". إذا كنت مهتمًا بالغوص بشكل أعمق ، فهناك العديد من البرامج التعليمية والدورات التدريبية والشهادات الخاصة بالبيانات الضخمة التي ستجعلك تسير على ما يرام.

لا تنتظر أكثر من ذلك ، اجعل هذا البرنامج التعليمي للبيانات الضخمة هو الشرارة التي تحتاجها لترويض وحش البيانات الضخمة.

إذا كنت مهتمًا بمعرفة المزيد عن البيانات الضخمة ، فراجع دبلومة PG في تخصص تطوير البرمجيات في برنامج البيانات الضخمة المصمم للمهنيين العاملين ويوفر أكثر من 7 دراسات حالة ومشاريع ، ويغطي 14 لغة وأدوات برمجة ، وتدريب عملي عملي ورش العمل ، أكثر من 400 ساعة من التعلم الصارم والمساعدة في التوظيف مع الشركات الكبرى.

تعلم دورات تطوير البرمجيات عبر الإنترنت من أفضل الجامعات في العالم. اربح برامج PG التنفيذية أو برامج الشهادات المتقدمة أو برامج الماجستير لتتبع حياتك المهنية بشكل سريع.

إتقان تكنولوجيا المستقبل - البيانات الضخمة

برنامج الشهادة المتقدم في البيانات الضخمة من معهد IIIT بنغالور