أهم 30 سؤالاً وإجابات لمقابلة مستودع البيانات في عام 2022 [للمستجدين وذوي الخبرة]

نشرت: 2021-01-06

ستكون أسئلة مقابلة مستودع البيانات المدرجة في هذه المقالة مفيدة لأولئك الذين يعملون في مجال مستودع البيانات وذكاء الأعمال. مع ظهور التعلم الآلي ، يجب تحليل حجم كبير من البيانات للحصول على الرؤى وتنفيذ النتائج بشكل أسرع. لقد ولت تلك الأيام عندما كانت خطوات معالجة البيانات عبارة عن تخزين البيانات والاستيعاب والجلب والمعالجة. ولكن مع زيادة حجم البيانات ، يجب معالجة هذه البيانات وإظهار نتائج فورية.

جميع الشركات مثل الرعاية الصحية ، BFSI ، والمرافق ، والعديد من المنظمات الحكومية تتغير إلى مستودع البيانات في علم البيانات. نتيجة لذلك ، يتم تعيين المزيد من المهنيين الذين لديهم خبرة في مستودع البيانات حتى يتمكنوا من تحليل كميات كبيرة من البيانات وتقديم رؤى ذات صلة. وبالتالي ، تصبح أسئلة المقابلة الخاصة بمستودع البيانات ذات صلة بكسر المقابلات بسهولة والحصول على المعرفة المهمة.

إذا كنت شغوفًا بمعالجة البيانات الضخمة وإدارة قواعد البيانات ، فإن مستودع البيانات يعد خيارًا مهنيًا رائعًا بالنسبة لك. في هذه المقالة ، ستحصل على أسئلة مقابلة مستودع البيانات التي يمكن أن تساعدك في التحضير للمقابلة التالية. الأسئلة من المستوى الأساسي إلى مستوى الخبراء ، لذلك سيستفيد كل من المتخصصين الجدد وذوي الخبرة من أسئلة المقابلة الخاصة بمستودع البيانات .

جدول المحتويات

أسئلة مقابلة مستودع البيانات

س 1: ما هي تحليلات البيانات من حيث مستودع البيانات؟

تحليلات البيانات هي علم للتحقق من البيانات الأولية لاستخلاص استنتاجات البيانات التي تعتمد على الأعمال. يتيح مستودع البيانات تحليل البيانات.

س 2: تحديد مستودع بيانات موجه نحو الموضوع؟

تخزن مستودعات البيانات الموضوعية البيانات حول نقطة معينة مثل المبيعات والعميل والمنتج.

س 3: ماذا يعني OLAP ، وما أنواعه؟

OLAP هو نظام يقوم بمعالجة وإدارة وتجميع البيانات متعددة الأبعاد للإدارة. إنها تعني المعالجة التحليلية عبر الإنترنت.

هناك أربعة أنواع من خوادم OLAP الموضحة أدناه:

  • الهجين OLAP
  • OLAP العلائقية
  • خوادم SQL المتخصصة
  • متعدد الأبعاد OLAP

س 4: ما هو الفرق بين OLAP و OLTP؟

OLAP عبارة عن أداة برمجية تُستخدم لتحليل البيانات تساعد في اتخاذ قرارات الأعمال بينما OLTP هو تطبيق موجه للمعاملات يستخدم في بنية ثلاثية المستويات. فيما يلي بعض الاختلافات بين OLAP و OLTP:

OLAP (المعالجة التحليلية عبر الإنترنت) OLTP (معالجة المعاملات عبر الإنترنت)
يحتوي على البيانات التاريخية التي تم جمعها من قواعد البيانات المختلفة. يحتوي على بيانات تشغيلية.
يتم استخدامه في تحليلات البيانات واستخراج البيانات واتخاذ القرار. إنه موجه للتطبيق ويستخدم في العديد من المهام المتعلقة بالأعمال.
يخزن كمية هائلة من البيانات وهو في تيرابايت. يخزن كمية صغيرة من البيانات ويتم تخزينها في MB ، GB ، إلخ.
إنه يعمل ببطء لأن حجم البيانات كبير. إنه يعمل بسرعة كبيرة ويتم إجراء الاستعلامات على 5٪ من البيانات المخزنة.
يحتاج النسخ الاحتياطي للبيانات من وقت لآخر فقط. النسخ الاحتياطي واستعادة البيانات يحدث بانتظام.
يتم استخدامه بشكل أساسي في عملية القراءة التي نادرًا ما تحدث عملية الكتابة. يتم استخدامه لكل من عمليات القراءة والكتابة.

س 5: ما هي الوظائف التي يقوم بها OLAP؟

بعض الوظائف الأساسية التي يؤديها OLAP هي Pivot و Drill-down و Roll-up و Slice و Dice.

س 6: ما هو مخطط ER؟

يرمز مخطط ER إلى مخطط العلاقة بين الكيانات والذي يوضح العلاقات المتبادلة بين الكيانات في قاعدة البيانات.

س 7: ما هو SCD؟

SCD تعني الأبعاد المتغيرة ببطء ، وهي تنطبق على مثل هذه الحالات التي تتغير فيها السجلات بمرور الوقت.

س 8: تحديد أنواع SCD.

هناك 3 أنواع من فقر الدم المنجلي كما هو موضح أدناه:

SCD 1: يحل الرقم القياسي الجديد محل السجل الأصلي.

SCD 2: يتم إضافة السجل الجديد إلى جدول العميل الحالي

SCD 3: البيانات الأصلية تحصل على تغييرات لإدخال البيانات الجديدة.

س 9: ما هو مخطط ندفة الثلج؟

مخطط ندفة الثلج هو مخطط يحتوي على جدول أبعاد أساسي. يمكن ضم بُعد واحد أو أكثر في جدول الأبعاد الأساسي. إنه الجدول الوحيد الذي يمكنه الانضمام إلى جدول الحقائق.

س 10: تحديد مخطط النجوم.

يشير Star Schema إلى إدارة الجدول بطريقة يمكن من خلالها استرداد النتائج بسهولة في بيئة مستودع البيانات.

س 11: تحديد مخطط الحافلة.

يتضمن مخطط BUS مجموعة من التعريفات الموحدة والأبعاد المؤكدة في حالة وجود جدول حقائق.

س 12: تحديد البيانات الوصفية.

يشير إلى بيانات حول البيانات. تتكون البيانات الوصفية من تفاصيل مثل ترتيب الحقول والعديد من الأعمدة المستخدمة وأنواع بيانات الحقول والعرض المحدود والعرض الثابت.

س 13: تحديد البعد الأساسي.

البعد الأساسي هو جدول أبعاد يُستخدم بشكل أساسي لسوق البيانات أو جدول حقائق واحد.

س 14: حدد الحلقات في مستودع البيانات.

توجد هذه الحلقات بين الجداول في مستودع البيانات. إذا كانت هناك أي حلقات بين الجداول ، فإن إنشاء الاستعلام يستغرق وقتًا أطول ويخلق لغزًا. لذلك يوصى دائمًا بتجنب أي حلقات بين الجداول.

س 15: اشرح XMLA.

يُطلق على XMLA اسم XML للتحليل ، والذي يوفر الطريقة القياسية للوصول إلى البيانات من OLAP واستخراج البيانات ومصادر البيانات الأخرى المتاحة عبر الإنترنت. إنه بروتوكول وصول بسيط إلى كائن يستخدم طرق الاكتشاف والتنفيذ. تقوم طريقة الاكتشاف باسترداد البيانات من الإنترنت ، ويتم استخدام طريقة التنفيذ لتنفيذ التطبيقات مقابل مصادر البيانات المختلفة.

قراءة: أسئلة مقابلة علوم البيانات

س 16: اشرح الفروق بين قاعدة البيانات ومستودع البيانات.

تختلف قاعدة البيانات عن مستودع البيانات حيث تستخدم قاعدة البيانات النموذج العلائقي لتخزين البيانات. في المقابل ، يستخدم مستودع البيانات مخططات أخرى ومخطط البدء هو واحد منهم. فيما يلي بعض الاختلافات بين قاعدة البيانات ومستودع البيانات:

ميزة قاعدة البيانات مستودع البيانات
نوع البيانات البيانات العلائقية أو البيانات الموجهة للكائنات بيانات كبيرة الحجم
عمليات معالجة المعاملات نمذجة البيانات وتحليل البيانات
أبعاد بيانات ثنائية الأبعاد بيانات متعددة الأبعاد
تصميم البيانات ER مقرها مخطط نجمة وندفة الثلج
حجم البيانات صغير كبير
وظائف أداء عالي وتوافر مرونة عالية

س 17: تحديد المكعب في مستودع البيانات.

المكعبات الموجودة في مستودع البيانات هي تمثيل لبيانات متعددة الأبعاد. يتكون نص المكعب من قيم البيانات ، وتحتوي حافة المكعب على أعضاء أبعاد.

س 18. اشرح أنواع مستودع البيانات؟

يتألف مستودع البيانات من الأنواع الثلاثة التالية:

  1. مستودع بيانات المؤسسة: في مستودع بيانات المؤسسة ، يتم دمج البيانات التنظيمية من المجالات الوظيفية المختلفة بطريقة مركزية. يساعد هذا في استخراج البيانات وتحويلها ، مما يوفر نظرة عامة مفصلة عن أي كائن في نموذج البيانات.
  2. مخزن البيانات التشغيلية: يساعد مخزن البيانات هذا في الوصول إلى البيانات مباشرةً من قاعدة البيانات كما يدعم معالجة المعاملات. يقوم بدمج بيانات التباين من مصادر مختلفة ، مما يدعم العمليات التجارية المختلفة في وقت لاحق.
  3. سوق البيانات: مخزن البيانات هذا يخزن البيانات لمنطقة وظيفية معينة. أيضًا ، يحتوي على البيانات في شكل مجموعات فرعية ، والتي يتم تخزينها بعد ذلك في مستودع البيانات. إنه يقلل من الحجم الكبير للبيانات للمستخدمين لتحليلها بكفاءة واكتساب رؤى.

Q19: بين OLAP متعدد الأبعاد و OLAP العلائقي ، الذي يعمل بشكل أسرع؟

يعمل OLAP متعدد الأبعاد بشكل أسرع من OLAP العلائقية.

  1. متعدد الأبعاد OLAP: في MOLAP ، يتم تخزين البيانات في مكعب متعدد الأبعاد. يتم تخزين البيانات بتنسيقات خاصة مثل ملف PowerOLAP.olp. تتوافق هذه المنتجات مع برنامج Excel وتجعل تفاعل البيانات أمرًا سهلاً.
  2. OLAP العلائقية: في منتجات OLAP العلائقية ، يمكن الوصول إلى قاعدة البيانات العلائقية باستخدام SQL ، وهي لغة قياسية تُستخدم لمعالجة البيانات في RDBMS. أثناء إجراء المعالجة ، فإنه يقبل طلبات العميل ، والتي تُترجم بعد ذلك إلى استعلامات SQL ثم يتم تمريرها إلى RDBMS.

س 20: اشرح الفروق بين المجموعات الهرمية الانقسامية والتكتل العنقودي.

في طريقة التجميع الهرمي التجميعي ، يمكن قراءة المجموعات من الأسفل إلى الأعلى ، مما يعني أن البرنامج يقرأ المكون الفرعي أولاً ثم الأصل. من ناحية أخرى ، تستخدم المجموعات الهرمية الخلافية الأسلوب من أعلى إلى أسفل حيث تتم قراءة البيانات على المستوى الأصلي أولاً ثم على المستوى الفرعي.

في طريقة التسلسل الهرمي التجميعي ، الكائنات موجودة ، وكل كائن يبني مجموعته ، وكل هذه المجموعات معًا تشكل كتلة كبيرة. تتكون هذه الطريقة بشكل أساسي من الدمج المستمر الذي يحدث حتى يتم إنشاء مجموعة كبيرة واحدة ، بينما يحدث تقسيم المجموعات في طريقة التجميع الانقسام. يتم تقسيم الكتلة الأم إلى مجموعات أصغر. يستمر تقسيم المجموعات هذا حتى تتكون كل مجموعة من كائن واحد.

تعرف على المزيد: علم البيانات مقابل التنقيب في البيانات: الفرق بين علم البيانات واستخراج البيانات

س 21: ما هي طريقة الحرباء في مستودع البيانات؟

الحرباء هي طريقة التجميع الهرمي في مستودع البيانات. تعمل هذه الطريقة على الرسم البياني المتناثر الذي يتكون من عقد وحواف. تمثل هذه العقد عناصر البيانات ، وتمثل الحواف الأوزان. من خلال هذا التمثيل ، يمكن إنشاء مجموعات البيانات والوصول إليها بسهولة للتغلب على أوجه القصور في الأساليب الحالية. تعمل الطريقة على مرحلتين:

  • في المرحلة الأولى ، يتم تقسيم الرسم البياني كجزء من عناصر البيانات التي يتم تقسيمها إلى العديد من المجموعات الفرعية.
  • في المرحلة الثانية ، يتم البحث عن المجموعات الأصلية التي يمكن دمجها بعد ذلك مع المجموعات الفرعية الأخرى التي تم إنشاؤها في المرحلة الأولى.

س 22: ما هي خطة التنفيذ ، وما هو الأسلوب الذي يستخدمه المحسن أثناء خطة التنفيذ؟

خطة التنفيذ هي الخطة التي يستخدمها المحسن لاختيار مجموعة من الخطوات لتنفيذ استعلامات SQL. يقوم المُحسِّن بتحديد مجموعة الخطوات الأكثر فاعلية لتنفيذ استعلامات SQL. يستخدم المحسن طريقتين في خطة التنفيذ ، أي القائمة على القواعد والقائمة على التكلفة.

س 23: ما هي الأدوات المختلفة المستخدمة في ETL (الاستخراج والتحويل والتحميل)؟

فيما يلي قائمة بأدوات ETL:

  • انفورماتيكا
  • وحي
  • مرحلة البيانات
  • مفرق البيانات
  • أب Initio
  • باني مستودع

س 24: ما وجه الاختلاف بين قواميس البيانات الوصفية والبيانات الوصفية؟

تصف البيانات الوصفية البيانات. يحتوي على جميع المعلومات حول البيانات مثل مصدر البيانات ومن قام بجمع البيانات وتنسيق البيانات. من الأهمية بمكان فهم المعلومات حول البيانات المخزنة في مستودعات البيانات. على الجانب الآخر ، فإن قاموس البيانات هو التعريف الأساسي لقاعدة البيانات. يتكون قاموس البيانات من الملفات الموجودة في قاعدة البيانات ، وعدد السجلات الموجودة في كل ملف ، وجميع المعلومات حول الحقول في قاعدة البيانات.

س 25: تحديد مستودع البيانات الافتراضية.

يوفر مستودع البيانات الافتراضي عرضًا جماعيًا للبيانات الكاملة. إنه مثل نموذج البيانات المنطقي للبيانات الوصفية ، ولا يحتوي على بيانات تاريخية. يعد مستودع البيانات الافتراضي هو أفضل طريقة لترجمة البيانات الأولية وتقديمها بالشكل الذي يستخدمه صناع القرار. يتم تمثيل البيانات كخريطة دلالية تتيح للمستخدمين النهائيين عرض البيانات في شكل افتراضي.

اقرأ أيضًا: أسئلة وأجوبة مقابلة محلل البيانات

س 26: ما هي الأساليب المستخدمة لتصميم مستودع البيانات؟

هناك طريقتان رئيسيتان مستخدمتان لتصميم مستودع البيانات:

  1. نهج Inmon: هو النهج من أعلى إلى أسفل حيث يتم إنشاء مستودع البيانات أولاً ، ثم يتم إنشاء مجموعات البيانات. في هذا النهج ، يعمل مستودع البيانات كمركز لمصنع معلومات الشركة ، ويعمل مستودع البيانات كإطار عمل منطقي.
  2. نهج Kimball: إنه النهج التصاعدي الذي يتم من خلاله إنشاء سوق البيانات أولاً. ثم يتم دمج سوق البيانات لتشكيل مستودع البيانات الكامل. يُطلق على تكامل مجموعات البيانات المختلفة اسم بنية ناقل مستودع البيانات.

س 27: ما هو مستودع البيانات في الوقت الفعلي وما فوائده؟

مستودع البيانات في الوقت الفعلي هو مفهوم مستودع البيانات الذي يلتقط البيانات في الوقت الفعلي بمجرد حدوثها ويجعلها متاحة في مستودع البيانات.

مزايا مستودع البيانات في الوقت الفعلي:

  • يساعد في اتخاذ القرار بسهولة.
  • يزيل نافذة الدُفعات.
  • يحل المشكلة المتعلقة بتحميل البيانات المثالي.
  • يوفر طريقة محسّنة لتشغيل عمليات التحويل في قاعدة البيانات.
  • يوفر استرداد سريع للبيانات.

س 28: اشرح بنية الطبقات الثلاث لدورة ETL.

تتكون دورة ETL من 3 طبقات:

  1. طبقة التدريج: تخزن هذه الطبقة البيانات المستخرجة من هياكل بيانات متعددة.
  2. طبقة تكامل البيانات: يتم نقل البيانات من طبقة التدريج إلى قاعدة البيانات بمساعدة طبقة التكامل. ثم يتم تنظيم هذه البيانات في مجموعات هرمية ، تسمى أيضًا الأبعاد والتجمعات والحقائق. الأبعاد والحقائق معًا تشكل المخطط.
  3. طبقة الوصول: يصل المستخدمون النهائيون إلى البيانات من خلال طبقة الوصول ويقومون بتحليل البيانات.

س 29: ما المقصود بتطهير البيانات؟

تطهير البيانات هي طريقة لإزالة البيانات بشكل دائم من تخزين البيانات. إنه يختلف عن حذف البيانات حيث أن حذف البيانات فقط يزيل البيانات مؤقتًا بينما تقوم إزالة البيانات بإزالة البيانات بشكل دائم ، ويتم استخدام المساحة الخالية لأغراض أخرى. يستخدم تطهير البيانات طرقًا مختلفة. يمكن أرشفة البيانات التي تم حذفها إذا لزم الأمر.

س 30: تحديد مراحل الاختبار في المشروع.

يتكون اختبار ETL من خمس مراحل كما هو مذكور أدناه:

  1. تحديد المتطلبات ومصادر البيانات
  2. الحصول على البيانات
  3. تنفيذ منطق الأعمال
  4. بناء البيانات ونشرها
  5. الإبلاغ

راجع أيضًا: علم البيانات مقابل البيانات الضخمة: الفرق بين علم البيانات والبيانات الضخمة

تلخيص لما سبق

كانت هذه الأسئلة الأكثر شيوعًا حول مقابلة مستودع البيانات والتي ستساعدك بالتأكيد في التحضير للمقابلة التالية. إذا كنت ترغب في معرفة المزيد عن مستودع البيانات ، فيمكنك زيارة upGrad والحصول على مزيد من المعرفة المتعمقة. يمكنك العثور على المعلومات ذات الصلة التي ستساعدك في فهم أسئلة مقابلة مستودع البيانات بشكل صحيح.

إذا كنت مهتمًا بالتعرف على علوم البيانات ، فراجع برنامج IIIT-B & upGrad التنفيذي PG في علوم البيانات الذي تم إنشاؤه للمهنيين العاملين ويقدم أكثر من 10 دراسات حالة ومشاريع ، وورش عمل عملية عملية ، وإرشاد مع خبراء الصناعة ، 1 - في 1 مع موجهين في الصناعة ، أكثر من 400 ساعة من التعلم والمساعدة في العمل مع الشركات الكبرى.

كيف أبدأ مسيرتي المهنية في تخزين البيانات؟

لقد تحول تخزين البيانات إلى منصب وظيفي مطلوب بسبب زيادة جمع واستخدام البيانات لكل مؤسسة. تبحث كل مؤسسة عن محترفين يمكنهم التعامل مع البيانات وتحويلها إلى رؤى قابلة للتنفيذ لاكتساب رؤى من البيانات.

بعض المهارات اللازمة للدخول إلى تخزين البيانات هي:

1. مهارات البحث وحل المشكلات والتحليل من الدرجة الأولى.
2. درجة البكالوريوس في علوم الكمبيوتر أو أي مجال آخر ذي صلة مثل تكنولوجيا المعلومات.
3. المعرفة الصحيحة بنظرية قاعدة البيانات العلائقية
4. خبرة في العمل مع أنظمة قواعد البيانات لمدة 3-5 سنوات
5. خبرة في العمل مع نمذجة البيانات والهندسة المعمارية
6. السيطرة على الاتصال الشفهي والكتابي.
7. جيد في الاستماع لفهم المعلومات المقدمة من قبل الأعضاء التقنيين وغير التقنيين

هذه بعض المهارات التي يحتاج المرء لبدء العمل عليها لبناء حياته المهنية في مجال تخزين البيانات.

كيف أبدأ مسيرتي المهنية في تخزين البيانات؟

هناك متطلبات معينة يحتاج المرء إلى الوفاء بها لبناء حياته المهنية في مجال تخزين البيانات.

1. أولاً ، يحتاج أي فرد إلى الحصول على درجة البكالوريوس في علوم الكمبيوتر أو المجالات ذات الصلة.
2. خبرة لا تقل عن سنتين في ترميز وإدارة خادم SQL أمر مهم.
3. فهم تكامل الخادم والعمل مع أدوات ETL
4. المعرفة الصحيحة لتخزين البيانات وتقنيات نمذجة البيانات
5. مهارات مكتب MS الأساسية

يمكن أن يؤدي الالتحاق بدورة تدريبية إلى جعل العملية برمتها بسيطة جدًا بالنسبة لك. هناك الكثير من البرامج التدريبية التي تقدمها الجامعات والمنصات المختلفة لإدارة قواعد البيانات وإدارة قواعد البيانات. في وقت لاحق ، يمكنك تولي وظيفة على مستوى المبتدئين لاكتساب الخبرة وفهم خصوصيات وعموميات المجال.

ما هي المراحل المختلفة لتخزين البيانات في أي شركة؟

بناءً على حجم الشركة وعمرها والصناعة ، ستكون مراحل تخزين البيانات ضمن الأربعة المذكورة أدناه.

1. قاعدة البيانات دون اتصال
2. مستودع البيانات غير المتصل
3. Ream-time Data Warehouse
4. مستودع البيانات المتكامل

تبدأ كل شركة بالمرحلة الأولى وتحاول الوصول إلى المرحلة الرابعة لدمج كل شيء في أنظمة الأعمال. يمكن أن يؤدي الأداء السليم لمخازن البيانات إلى تسهيل قيام مدير مخزن البيانات بتحليل البيانات وإنشاء رؤى قابلة للتنفيذ منها.