أهم الأسئلة التقريبية والطرق الإعلامية لعلوم البيانات [2022]
نشرت: 2021-01-06ما هو Guesstimate؟
Guesstimate هي طريقة منهجية للنظرية والتقييم ؛ يساعدك على العمل بكفاءة وبدرجة أعلى من الدقة. إنها دراسة البيانات لتوحيد النتيجة. كما أنه جزء أساسي من محلل الأعمال أو مهندسي علوم البيانات والبيانات أو تقنيي البيانات.
- المعنى: يتعلق الأمر بفهم المشكلة التي تريد حلها ، وما الغرض من ذلك ، ولماذا تريد حلها.
- التعريف: يتعلق الأمر بكائن معين ومدخلات ومخرجات لتدفق العملية. لوضعها في كلمة ، شرح.
- التخمين : يتعلق الأمر بالفكر والاستنتاج - أنت تصنع كائنًا معينًا في مشكلتك.
- التقدير: يتعلق بتقدير الأرقام في مشكلة معينة.
- ابتكر فكرة : نفذ الفكرة بالبحث والتطوير.
عندما يمكن لسؤال تخميني أن يسأل عن حجم السوق ، فإنه يُطلق عليه حينئذٍ سؤال "حجم السوق".
فيما يلي الأسئلة الأساسية حول التخمين:
- كم عدد الأشخاص الذين يرتدون اللون الأزرق في نيويورك في يوم إثنين عادي؟
- كم عدد كرات التنس التي يمكنك وضعها في الطائرة؟
كيف تقترب من Guesstimate؟
عملية حل مشكلة التخمين يمكن التحكم فيها:
- انظر إلى المعلمات المجدية التي قد تؤثر على الكمية النهائية وتقدير أعدادها.
- خذ خطوة إلى الوراء وفكر.
- وضح أفكارك.
- عبر عن أفكارك.
- نهج الرياضيات البسيط-
يتم استخدام هذا الأسلوب عادةً عندما يكون الرقم المراد تخمينه هو نسبة من بعض الأنواع. المهم هو الحصول على البسط والمقام ثم ننتهي!
1. نهج نصيب الفرد-
يتم استخدام هذا النهج عندما يمكن اعتبار الرقم المراد تخمينه عنصرًا استهلاكيًا على مستوى الشخص أو الأسرة أو السكان داخل المنطقة الجغرافية.
2. نهج العرض والطلب-
يحتاج هذا النهج إلى التفكير في الرقم التخميني من جانب العرض أو الطلب (أو كليهما) من العنصر.
بشكل عام ، يمكنك اقتراح التخمينات بإحدى الطريقتين التاليتين:
- طريقة من أعلى إلى أسفل
- طريقة من أسفل إلى أعلى
من الأعلى إلى الأسفل ، تبدأ بأكبر كون ممكن ، والذي يكون تخمينك جزءًا منه.
مع أوسع قاعدة في الأعلى. لهذا الكون ، ستستمر بعد ذلك في تطبيق مجموعة من الشروط أو المرشحات (كيفما تريد وضعها) التي تقلل الرقم من الكون إلى رقم مناسب لتخمينك.
يكمن مفتاح عملية التقدير التنازلي في:
- إنه يحدد بدقة بداية الكون.
- إنه يحدد بدقة أكبر عدد من الشروط / الفلاتر والشرائح ذات الصلة التي تنطبق على مشكلتك التخمينية.
- الشرائح: في كثير من الأحيان ، سيتعين عليك أولاً تقسيم الكون إلى مجموعات وتطبيق عوامل تصفية مختلفة على كل شريحة.
نصائح حول الأسئلة التخمينية لعلوم البيانات:
- العرض التدريبي: علينا أن نقوم بممارسة تقديم الحل المعين الذي أكملته للجمهور.
- تحليل الممارسة: يلعب التحليل دورًا حيويًا في إجراء عمليات التفكير حول مشكلة معينة.
- التدرب على الأرقام: من المهم دائمًا اللعب بالأرقام أو إنشاء منطق مخصص.
أثناء حل الأسئلة الإرشادية لعلوم البيانات ، تحتاج إلى فهم هذه النقاط:
- أنت تصف هذا لشخص ليس في رأسك. الحل ليس لك.
- في الوقت نفسه ، تذكر عدم تحويل كل جانب إلى تخمين جديد تمامًا بحد ذاته! من السهل أن تتأثر بذكائك وقدراتك التحليلية.
- ركز على السؤال. هل سمعت عن شلل تحليلي؟
ما هي أغراض الأسئلة التخمينية لعلوم البيانات؟
- لفهم قدرتك على فهم الموقف.
- لفهم نطاق قدرتك على ربط الأشياء ، للوصول إلى إجابة.
- لمعرفة قوتك لتحديد الأولويات واستبعاد المعلمات المختلفة.
- لفهم مدى جودة عملك مع المعلومات غير الكافية.
فيما يلي بعض الأسئلة الإرشادية لعلوم البيانات-
السؤال: 1 قم بإنشاء تجربة باستخدام خوارزمية k-mean في مجموعة بيانات UCI Iris:
في هذه التجربة ، قم بإجراء تجميع للوسائل k باستخدام جميع الميزات الموجودة في مجموعة البيانات ، ثم قارن نتائج المجموعات مع تسمية الفئة الحقيقية لجميع العينات.
استخدم الوحدة النمطية Multiclass Logistic Regression لإجراء تصنيف متعدد الفئات ومقارنة أدائها بأداء التجميع k-mean clustering.
السؤال: 2 بتنسيق بسيط للغاية ، اشرح الدقة والاستدعاء؟
السؤال: 3 إذا تم إعطاؤك مجموعة بيانات ، فكيف يمكنك تحديد خوارزمية ML للمستخدم؟
السؤال: 4 هل الأفضل أن يكون لديك الكثير من الإيجابيات الكاذبة؟ أو الكثير من السلبيات الخاطئة؟

السؤال: 5 ما هي دقة النموذج وأداء النموذج؟ ما هو السيناريو الذي يمكنك تطبيقه؟
السؤال: 6 كيف تتأكد من أنك لا تفرط في استخدام النموذج؟ اشرح بمثال.
السؤال: 7 عندما تقوم بتشغيل خوارزمية شجرة تصنيف ثنائية تكون سهلة للغاية. في الخوارزمية الثنائية ، كيف تقرر الشجرة المتغير الذي يجب تقسيمه في عقدة الجذر والعقد الفرعية التالية؟
السؤال 8: كيف يتم وصف NumPy و SciPy؟
السؤال: 9 اكتب برنامجًا أساسيًا لتعلم الآلة للتحقق من دقة مجموعة البيانات التي تستورد أي مجموعة بيانات باستخدام أي مصنف؟
السؤال: 10 قم بإنشاء خوارزمية الانحدار للتنبؤ بسعر السيارة بناءً على متغيرات مختلفة.
السؤال: 11 قم بتطوير نموذج يستخدم ميزات مختلفة للشبكة لاكتشاف أنشطة الشبكة التي تعد جزءًا من اقتحام / هجوم باستخدام التصنيفات الثنائية.
السؤال: 12 كيفية التجميع (التجميع) للعثور على منظمات مماثلة معًا بناءً على وصف ويكيبيديا الخاص بهم.
السؤال: 13 كيف تتوقع من سيقوم بتجديد الاشتراكات الشهر المقبل؟
- ما البيانات التي تحتاجها لحل هذا؟
- ما نوع التحليل الذي ستفعله؟
- ما نوع خوارزميات النماذج التنبؤية التي ستكون مطلوبة؟
السؤال: 14 كيف يمكنك ربط الأسماء المستعارة (Alen ، Bob ، Alex ، Tim ، إلخ) بالأسماء الحقيقية؟
السؤال: 15 قم بإنشاء تنبؤ حول ما إذا كانت رحلة الركاب المجدولة قد تأخرت أم لا باستخدام مصنف ثنائي مع نص R أو Python.
السؤال: 16 توقع أسعار السيارات باستخدام الانحدار الخطي مع إعداد البيانات وتنظيفها عن طريق إزالة عمود الخسائر المعيارية.
نظرًا لأنه يحتوي على العديد من القيم المفقودة ، قم بإنشاء تجربة ونموذج.
السؤال: 17 كم عدد الطرق التي يمكنك بها تقسيم 14 شخصًا إلى 4 فرق من 5؟
السؤال: 18 المنطقة الواقعة تحت المنحنى الطبيعي القياسي هي؟
- أكبر من 1
- يساوي 1
- أقل من 1
السؤال: 19 قم بإنشاء خوارزمية الانحدار للتنبؤ بسعر السيارة بناءً على متغيرات مختلفة.
السؤال: 20 طلب مديرك بناء نموذج غابة عشوائي من 10000 شجرة أثناء التدريب ، ووجدت خطأ تدريب 0.00. ولكن ، عند الاختبار ، كان خطأ التحقق من الصحة 34.23. ما هو الأساس الذي ستفترضه ما الخطأ الذي حدث؟ كيف يمكنك التحقق من النموذج الخاص بك إذا لم يتم تدريبه بشكل مثالي؟
السؤال: 21 تعتمد توصيات "الأشخاص الذين اشتروا هذا ، واشتروا أيضًا ..." التي تظهر على Amazon على أي خوارزمية؟
السؤال: 22 ما الخوارزميات المرتبطة في التوصيات التي تراها "أخبار وآراء اليوم"؟
قراءة: أسئلة مقابلة علوم البيانات
خاتمة
نأمل أن تساعدك هذه المقالة في فهم الأسئلة التخمينية لعلوم البيانات وكيفية التغلب عليها. ستجد المزيد من المقالات المفيدة مثل هذا في upGrad ؛ نحن نقدم مجموعة واسعة من الدورات ، ماجستير إدارة الأعمال ، علوم البيانات ، تعلم الآلة ، إلخ. نحن نقدم الإرشاد من أفضل الأفراد في الصناعة!
إذا كنت مهتمًا بتعلم علوم البيانات واخترت مهنة في هذا المجال ، فراجع برنامج IIIT-B & upGrad's Executive PG في علوم البيانات الذي تم إنشاؤه للمهنيين العاملين ويقدم أكثر من 10 دراسات حالة ومشاريع ، وورش عمل عملية عملية ، والإرشاد مع خبراء الصناعة ، وجهاً لوجه مع مرشدين في الصناعة ، وأكثر من 400 ساعة من التعلم والمساعدة في العمل مع الشركات الكبرى.
ما هي الخطوات المثالية لحل مشكلة التخمين؟
قبل الإجابة على سؤال تخميني ، من الحكمة مراعاة بعض النقاط للتوصل إلى فكرة أفضل. هذه النقاط هي كما يلي - قبل البدء في الإجابة ، يجب عليك إزالة كل شكوكك فيما يتعلق بالسؤال. يمكنك طرح العديد من الأسئلة ذات الصلة كما تريد على القائم بإجراء المقابلة ولكن حاول تجنب الأسئلة التي تؤدي إلى أي حساب رقمي. قد يكون لهذا تأثير سيء على القائم بإجراء المقابلة. يُنصح بالتمسك بأسئلة نعم أو لا لتجنب أي انطباع سيء. لا تحاول حل المشكلة دفعة واحدة ، وبدلاً من ذلك قسمها إلى مشكلات فرعية أصغر ثم حاول حل كل مشكلة أصغر. تذكر أنه لا تقسم مشكلتك إلى أكثر من 6 خطوات. ستساعدك هذه الطريقة في الوصول إلى الإجابة حتى من خلال الحسابات المطولة.
ما هو Guesstimate؟
يدور Guesstimate حول فهم المشكلة وإيجاد النهج الصحيح لحلها. إنها طريقة منهجية للنظرية والتقييم. أهم شيء في مثل هذه الأسئلة هو كيف تشرح الحل.
قد يبدو الترحيب بالضيوف وكأنه مهمة شاقة ، خاصة عندما تنظر لأول مرة إلى نوع الأسئلة المطروحة. من أحجام السوق للتكتلات الكبيرة إلى الإيرادات والسكان ، فإن حساب بعض هذه الكميات حتى بالقرب من الملعب أمر مستحيل من الناحية الواقعية.
ما هي الأساليب المختلفة لحل مشكلة التخمين؟
نهج الرياضيات البسيط - هذا النهج هو في الغالب في الحالات التي يكون فيها الرقم المراد تقديره نوعًا من النسبة. نهج نصيب الفرد - يتم استخدام هذا النهج عندما يمكن اعتبار الرقم المراد تخمينه عنصرًا استهلاكيًا على مستوى الفرد أو الأسرة أو السكان داخل المنطقة الجغرافية. نهج العرض والطلب - يحتاج هذا النهج إلى التفكير في الرقم إما من جانب العرض أو جانب الطلب.