أسئلة وأجوبة مقابلة HBase الأكثر شيوعًا [الدليل النهائي]
نشرت: 2020-09-21يعد Apache HBase حلاً ممتازًا للبيانات الضخمة عندما تريد أن يقوم تطبيقك بدفع البيانات أو سحبها في الوقت الفعلي. وهي معروفة بشكل أساسي بمخططها المرن وسرعتها العالية. تهدف هذه المقالة إلى تزويدك بالإجابات على بعض أهم أسئلة مقابلة HBase . يريد القائمون بالمقابلة اختبار الوعي الفني وكذلك الوعي العام للمرشحين. لذلك ، يجب أن يكون جهدك هو توصيل المفاهيم بدقة وشاملة.
تستخدم العديد من الشركات الرائدة تقنية Hbase حول العالم ، بما في ذلك Adobe و HubSpot و Facebook و Twitter و Yahoo! و OpenLogic و StumbleUpon. بالنسبة لمطوري الويب الطموحين الذين يتطلعون إلى إنشاء مواقع ويب قابلة للتطوير ، فإن إتقان أدوات مثل Hadoop و HBase يمكن أن يكون مفيدًا للغاية.
تعلم علم البيانات من أفضل الجامعات في العالم. اربح برامج PG التنفيذية أو برامج الشهادات المتقدمة أو برامج الماجستير لتتبع حياتك المهنية بشكل سريع.
قراءة: أفكار مشروع Hadoop
جدول المحتويات
أعلى أسئلة وأجوبة مقابلة HBase
1. ما هو HBase؟
إنها قاعدة بيانات موجهة نحو الأعمدة طورتها مؤسسة Apache Software Foundation. يعمل HBase على قمة مجموعة Hadoop ، ويتم استخدامه لتخزين البيانات شبه المنظمة وغير المهيكلة. لذلك ، لا يحتوي على مخطط صارم مثل مخطط قاعدة البيانات العلائقية التقليدية. كما أنه لا يدعم بنية بناء جملة SQL. يقوم HBase بتخزين البيانات وتشغيلها من خلال عقدة رئيسية تنظم الخوادم العنقودية والمنطقة.
2. ما هي أسباب استخدام Hbase؟
يوفر HBase نظام تخزين عالي السعة وعمليات قراءة وكتابة عشوائية. يمكنه التعامل مع مجموعات البيانات الكبيرة ، وإجراء عدة عمليات في الثانية. يجعل التصميم الموزع والقابل للتحجيم أفقيًا HBase خيارًا شائعًا لتطبيقات الوقت الفعلي.
3. شرح المكونات الرئيسية لـ HBase.
تتضمن أجزاء العمل في HBase جداول Zookeeper و HBase Master و RegionServer والمنطقة والكتالوج. يمكن وصف الغرض من كل عنصر على النحو التالي:
- ينسق Zookeeper بين العميل و HBase Master
- يراقب HBase Master خادم RegionServer ويعتني بوظائف المسؤول
- RegionServer يشرف على المنطقة
- تحتوي المنطقة على MemStore و HFile
- تتكون جداول الكتالوج من ROOT و META
يتكون Hbase بشكل أساسي من مجموعة من الجداول مع كل جدول يحتوي على صفوف وأعمدة ومفتاح أساسي. إنه عمود HBase الذي يشير إلى سمة الكائن.
4. ما هي أنواع الأوامر التشغيلية المختلفة في HBase؟
هناك خمسة أوامر تشغيلية حاسمة في HBase: Get، Delete، Put، Increment، and Scan.
يستخدم Get لقراءة الجدول. يتم تنفيذه عبر HTable.get ، ويعيد بيانات أو سمات صف معين من الجدول. يؤدي الحذف إلى إزالة الصفوف من الجدول ، بينما يضيف "وضع" الصفوف أو تحديثها. تتيح الزيادة عمليات الزيادة في صف واحد. أخيرًا ، يتم استخدام الفحص للتكرار عبر صفوف متعددة لسمات معينة.
5. ماذا تفهم من قبل WAL و Hlog؟
- يرمز WAL إلى Write Ahead Log وهو مشابه تمامًا لسجل BIN في MySQL. يسجل جميع التغييرات في البيانات.
- HLog هو ملف تسلسل قياسي في الذاكرة من Hadoop يحافظ على متجر HLogkey.
يعمل كل من WAL و HLog بمثابة خطوط الحياة في أحداث فشل الخادم وفقدان البيانات. في حالة تعطل RegionServer أو عدم توفره ، تضمن ملفات WAL إمكانية إعادة تشغيل تغييرات البيانات.
6. صف بعض المواقف التي قد تستخدم فيها Hbase.
من المناسب استخدام HBase عندما:
- حجم البيانات الخاصة بك ضخم ، مما يتطلب منك العمل على ملايين السجلات.
- أنت تقوم بتنفيذ إعادة تصميم كاملة وإصلاح لنظام RDBMS التقليدي.
- لديك الموارد اللازمة للقيام بالاستثمار في البنية التحتية في مجموعات.
- هناك أوامر معينة لا تحتوي على SQL ، مثل المعاملات والأعمدة المكتوبة والخطوط الداخلية وما إلى ذلك.
7. ماذا تقصد بعائلات الأعمدة ومفاتيح الصفوف؟
تشكل عائلات الأعمدة وحدات التخزين الأساسية في HBase. يتم تحديدها أثناء إنشاء الجدول وتخزينها معًا على القرص ، مما يسمح لاحقًا بتطبيق ميزات مثل الضغط.
يتيح مفتاح الصف التجميع المنطقي للخلايا. يكون مسبوقًا بالمفتاح المدمج ، مما يتيح للتطبيق تحديد ترتيب الفرز. بهذه الطريقة ، يمكن حفظ جميع الخلايا التي لها نفس مفتاح الصف على نفس الخادم.
8. كيف تختلف HBase عن قاعدة البيانات العلائقية؟
يختلف HBase عن قاعدة البيانات العلائقية لأنه مخزن بيانات ذو مخطط أقل وموجه نحو الأعمدة يحتوي على جداول قليلة السكان. قاعدة البيانات العلائقية قائمة على المخطط ، وموجهة نحو الصفوف ، وتخزن البيانات المعيارية في جداول رفيعة. علاوة على ذلك ، يتمتع HBase بميزة التقسيم الآلي ، بينما لا يوجد مثل هذا الدعم المدمج في RDBMS.

قراءة: DBMS مقابل RDBMS: الفرق بين DBMS و RDBMS
9. ما الذي يشكل خلية في HBase؟
الخلايا هي أصغر وحدات جداول HBase ، وتحمل البيانات في شكل مجموعات. المجموعة هي بنية بيانات تتكون من أجزاء متعددة. في HBase ، يتكون من {row، column، version}.
10. تحديد الضغط في HBase.
الضغط هو العملية المستخدمة لدمج ملفات HFiles في ملف واحد قبل إزالة الملفات القديمة من قاعدة البيانات.
11. هل يمكنك الوصول إلى HFile مباشرة دون استخدام HBase؟
نعم ، هناك تقنية فريدة للوصول إلى HFile مباشرة بدون مساعدة HBase. يمكن استخدام طريقة HFile.main لهذا الغرض.
12. مناقشة الحذف وعلامات شواهد القبور في HBase.
في HBase ، ينتج عن عملية الحذف العادية علامة علامة مميزة. تصبح الخلايا المحذوفة غير مرئية ، لكن البيانات التي تمثلها تتم إزالتها فعليًا أثناء الضغط. يحتوي HBase على ثلاثة أنواع من علامات شواهد القبور:
- علامة حذف الإصدار: تحدد إصدارًا واحدًا من العمود للحذف
- علامة حذف العمود: تحدد جميع إصدارات العمود
- محدد حذف العائلة: يقوم بإعداد جميع أعمدة عائلة الأعمدة للحذف
هنا ، تجدر الإشارة إلى أنه سيتم حذف صف في HBase بالكامل بعد الضغط الرئيسي. لذلك ، عند حذف وإضافة المزيد من البيانات ، قد يتم إخفاء Gets بواسطة علامات علامة مميزة ، وقد لا ترى القيم المدرجة إلا بعد عمليات الضغط.
13. ماذا يحدث عند تغيير حجم الكتلة لعائلة الأعمدة؟
إذا كانت قاعدة البيانات الخاصة بك مشغولة بالفعل وترغب في تغيير حجم كتلة عائلة العمود في HBase ، فقد تظل البيانات القديمة في حجم الكتلة القديم. أثناء الضغط ، تتصرف البيانات القديمة والجديدة على النحو التالي:
- ستأخذ البيانات الموجودة حجم الكتلة الجديد وتستمر قراءتها بشكل صحيح.
- سيكون للملفات الجديدة حجم الكتلة الجديد.
بهذه الطريقة ، تتحول جميع البيانات إلى حجم الكتلة المطلوب قبل الضغط الرئيسي التالي.
14. تحديد الأوضاع المختلفة التي يمكن لـ HBase تشغيلها.
يمكن تشغيل HBase إما في الوضع المستقل أو في الوضع الموزع. Standalone هو الوضع الافتراضي لـ HBase الذي يستخدم نظام الملفات المحلي بدلاً من HDFS. بالنسبة للوضع الموزع ، يمكن تقسيمه بشكل إضافي إلى:
- الوضع الموزع الزائف: تعمل جميع الشياطين على عقدة واحدة
- الوضع الموزع بالكامل: يتم تشغيل Daemons عبر جميع العقد في الكتلة
15. كيف ستنفذ الصلات في HBase؟
يستخدم HBase وظائف MapReduce لمعالجة تيرابايت من البيانات بطريقة قابلة للتطوير. لا يدعم الصلات مباشرة ، ولكن يتم تنفيذ استعلامات الصلة عن طريق استرداد البيانات من جداول HBase.
تسجيل الخروج: أسئلة مقابلة Hadoop
16. ناقش الغرض من المرشحات في HBase.
تم إدخال عوامل التصفية في Apache HBase 0.92 لمساعدة المستخدمين على الوصول إلى HBase عبر Shell أو Thrift. لذلك ، فهم يعتنون باحتياجات التصفية من جانب الخادم. هناك أيضًا عوامل تصفية للتزيين تعمل على توسيع استخدامات المرشحات للحصول على تحكم إضافي في البيانات التي يتم إرجاعها. فيما يلي بعض الأمثلة على المرشحات في HBase:
- عامل تصفية بلوم: يُستخدم عادةً للاستعلامات في الوقت الفعلي ، وهو وسيلة فعالة من حيث المساحة لمعرفة ما إذا كان ملف HFile يتضمن صفًا أو خلية معينة
- عامل تصفية الصفحة: بقبول حجم الصفحة كمعامل ، يمكن لمرشح الصفحة تحسين فحص مناطق الموارد البشرية الفردية
17. قارن HBase بـ (i) Cassandra (ii) Hive.
(ط) HBase و Cassandra: كل من Cassandra و HBase هي قواعد بيانات NoSQL مصممة لإدارة مجموعات البيانات الكبيرة. ومع ذلك ، تم تصميم بناء جملة لغة Cassandra Query (CQL ) بعد SQL. في كلا مخازن البيانات ، يشكل مفتاح الصف الفهرس الأساسي. يمكن لـ Cassandra إنشاء فهارس ثانوية على قيم الأعمدة. وبالتالي ، يمكنه تحسين الوصول إلى البيانات في أعمدة ذات مستويات عالية من التكرار. تفتقر HBase إلى هذا الحكم ولكن لديها آليات أخرى لإدخال وظيفة الفهرس الثانوية. يمكن العثور على هذه الطرق بسهولة في الأدلة المرجعية عبر الإنترنت.
(2) HBase و Hive: كلاهما يعتمد على تقنيات Hadoop. كما نوقش أعلاه ، HBase هي قاعدة بيانات NoSQL للمفتاح / القيمة. من ناحية أخرى ، فإن Hive هو محرك يشبه SQL قادر على تشغيل وظائف MapReduce المعقدة. يمكنك إجراء عمليات قراءة وكتابة البيانات من Hive إلى HBase والعكس. بينما يعد Hive أكثر ملاءمة للمهام التحليلية ، يعد HBase حلاً ممتازًا للاستعلام في الوقت الفعلي.
اقرأ أيضًا: HBase Architecture: كل ما تحتاج إلى معرفته
خاتمة
أسئلة مقابلة HBase وحالات الاستخدام هذه توصلنا إلى نهاية هذه المقالة. حاولنا تغطية مواضيع مختلفة لتلبية المستويات الأساسية والمتوسطة والمتقدمة. لذا ، استمر في المراجعة لتترك انطباعًا رائعًا عن المجند الخاص بك!
إذا كنت مهتمًا بالتعرف على علوم البيانات ، فراجع برنامج IIIT-B & upGrad التنفيذي PG في علوم البيانات الذي تم إنشاؤه للمهنيين العاملين ويقدم أكثر من 10 دراسات حالة ومشاريع ، وورش عمل عملية عملية ، وإرشاد مع خبراء الصناعة ، 1 - في 1 مع موجهين في الصناعة ، أكثر من 400 ساعة من التعلم والمساعدة في العمل مع الشركات الكبرى.