Scikit-Learn in Python: الميزات والمتطلبات المسبقة والإيجابيات والسلبيات

نشرت: 2020-06-11

يجب أن تدرك مدى أهمية امتلاك مكتبة قوية إذا كنت معتادًا على برمجة بايثون. عندما يتعلق الأمر بمكتبات تعلم الآلة المجانية للبايثون ، فإن scikit-Learn هو أفضل ما يمكنك الحصول عليه! sklearn أو scikit-learn في Python هي مكتبة مجانية تبسط مهمة الترميز وتطبيق خوارزميات التعلم الآلي في Python.

إلى جانب دعم مكتبات Python العلمية والرقمية مثل SciPy و NumPy ، يتميز scikit-Learn بمجموعة من الخوارزميات المختلفة مثل الغابات العشوائية وآلات المتجهات الداعمة وجيران k. لذلك ، دعنا نتعرف على بعض الجوانب الأساسية لإحدى أدوات التعلم الآلي الأساسية التي يمكنك العثور عليها.

جدول المحتويات

ما هو sklearn أو scikit-Learn في بايثون؟

تعد Sklearn أو scikit-Learn في Python واحدة من أكثر المكتبات مفتوحة المصدر فائدة والتي يمكنك استخدامها للتعلم الآلي في Python. مكتبة scikit-Learn عبارة عن مجموعة شاملة من أكثر الأدوات فعالية للنمذجة الإحصائية والتعلم الآلي. تتضمن بعض هذه الأدوات الانحدار والتصنيف وتقليل الأبعاد والتكتل.

تمت كتابة مكتبة scikit-Learn بشكل أساسي بلغة Python وتم بناؤها على SciPy و NumPy و Matplotlib. تستخدم المكتبة واجهة Python موحدة ومتسقة لتنفيذ العديد من خوارزميات المعالجة المسبقة والتعلم الآلي والتصور والتحقق المتبادل.

تاريخ موجز لـ Scikit-Learn

عُرف في البداية باسم scikit-Learn ، تم تطوير sklearn في Python بواسطة David Cournapeau في عام 2007 كجزء من مشروع Google الصيفي للتعليمات البرمجية. بعد ذلك ، أصدر Gael Varoquaux و Fabian Pedregosa و Alexandre Gramfort و Vincent Michel ، من المعهد الفرنسي لأبحاث علوم الكمبيوتر والأتمتة ، إصدارًا تجريبيًا v0.1 في العام 2010.

منذ ذلك الحين ، تم إطلاق إصدارات أحدث من scikit-Learn ، مع الإصدار الأخير 0.23.1 الذي تم إصداره في مايو 2020. Scikit-Learn هو مشروع يحركه المجتمع حيث يمكن لأي شخص المساهمة في تطويره. تعد Microsoft و Intel و NVIDIA من بين كبار رعاة المشروع.

الميزات الأساسية لبرنامج scikit-Learn

مكتبة تعلم الآلة scikit-Learn في Python تأتي مع عدد كبير من الميزات لتبسيط التعلم الآلي. هنا سنناقش بعضها:

  • خوارزميات التعلم الخاضع للإشراف: أي خوارزمية تعلم آلي خاضعة للإشراف قد تكون سمعت عنها لديها احتمالية عالية جدًا للانتماء إلى مكتبة scikit-Learn. تحتوي مجموعة أدوات scikit-Learn على ذخيرة من خوارزميات التعلم الخاضعة للإشراف ، والتي تتضمن - النماذج الخطية المعممة مثل الانحدار الخطي ، وأشجار القرار ، وآلات المتجهات الداعمة ، وطرق بايز.
  • خوارزميات التعلم غير الخاضعة للإشراف: تتضمن مجموعة الخوارزمية هذه العوملة ، وتحليل الكتلة ، وتحليل المكونات الرئيسية ، والشبكات العصبية غير الخاضعة للإشراف.
  • استخراج الميزة: باستخدام scikit-Learn ، يمكنك استخراج الميزات من النص والصور.
  • التحقق المتقاطع: يمكن التحقق من دقة وصلاحية النماذج الخاضعة للإشراف على البيانات غير المرئية بمساعدة scikit-Learn.
  • تقليل الأبعاد: باستخدام هذه الميزة ، يمكن تقليل عدد السمات في البيانات من أجل التصور اللاحق والتلخيص واختيار الميزة.
  • التجميع: تسمح هذه الميزة بتجميع البيانات غير المسماة.
  • طرق التجميع: يمكن دمج تنبؤات العديد من النماذج الخاضعة للإشراف باستخدام هذه الميزة.

اقرأ المزيد: 6 أنواع من التعلم الخاضع للإشراف يجب أن تعرفه

المتطلبات الأساسية لبدء scikit-Learn

قبل أن تبدأ في استخدام أحدث إصدار من scikit-Learn ، تأكد من تثبيت المكتبات التالية:

  • بايثون (> = 3.5)
  • NumPy (> = 1.11.0)
  • SciPy (> = 0.17.0) لي
  • Joblib (> = 0.11)
  • Matplotlib (> = 1.5.1): هذه المكتبة مطلوبة لإمكانيات رسم scikit-Learn.
  • Pandas (> = 0.18.0): هذا مطلوب لهيكل البيانات وتحليلها.

تثبيت scikit-learn

يمكنك اتباع إحدى الطريقتين التاليتين لتثبيت scikit-Learn:

  • باستخدام النقطة

- يمكن تثبيت Scikit-Learn عبر نقطة وسطر الأوامر الخاص به كما يلي:

تثبيت Pip -U scikit-Learn

  • باستخدام Conda

- يمكن أيضًا تثبيت Scikit-Learn عبر conda وسطر الأوامر المستخدم على النحو التالي:

conda تثبيت scikit-learn

إذا لم يكن لديك NumPy و SciPy مثبتين ، فيمكنك تثبيتهما عبر pip أو conda. Anaconda و Canopy هما توزيعان آخران للبايثون يمكن استخدامهما لتعلم أحدث إصدار من scikit-Learn.

تعلم دورة علوم البيانات من أفضل الجامعات في العالم. اربح برامج PG التنفيذية أو برامج الشهادات المتقدمة أو برامج الماجستير لتتبع حياتك المهنية بشكل سريع.

إيجابيات وسلبيات scikit-Learn

الايجابيات:

  • يتم توزيع المكتبة بموجب ترخيص BSD ، مما يجعلها مجانية مع الحد الأدنى من القيود القانونية والتراخيص.
  • سهلة الاستخدام.
  • مكتبة scikit-Learn متعددة الاستخدامات وسهلة الاستخدام وتخدم أغراض العالم الحقيقي مثل التنبؤ بسلوك المستهلك ، وإنشاء صور عصبية ، وما إلى ذلك.
  • يتم دعم وتحديث Scikit-Learn من قبل العديد من المؤلفين والمساهمين ومجتمع دولي واسع عبر الإنترنت.
  • يوفر موقع الويب scikit-Learn توثيقًا تفصيليًا لواجهة برمجة التطبيقات للمستخدمين الذين يرغبون في دمج الخوارزميات مع الأنظمة الأساسية الخاصة بهم.

يخدع:

  • إنه ليس الخيار الأفضل للتعلم المتعمق.

مزيد من المعلومات: كيف يعمل التعلم الآلي غير الخاضع للإشراف؟

خاتمة

يتطلب نمو وشعبية لغة التعلم الآلي أدوات فعالة ، ويخدم sklearn في Python حاجة المبتدئين وكذلك أولئك الذين يحلون مشاكل التعلم تحت الإشراف. تجعل الكفاءة والتنوع في الاستخدام scikit-Learn أحد الخيارات الرئيسية للمؤسسات الأكاديمية والصناعية لأداء عمليات مختلفة.

ما هو scikit-Learn في بايثون؟

Scikit-Learn هي مكتبة برامج مجانية للغة برمجة Python توفر مجموعة من الخوارزميات للتعلم الآلي واستخراج البيانات. إنه يتميز بخوارزميات تصنيف وانحدار وتجميع مختلفة بما في ذلك آلات ناقلات الدعم والغابات العشوائية والتعزيز والوسائل k و DBSCAN ، وهو مصمم للتعامل مع مكتبات Python الرقمية والعلمية NumPy و SciPy. تم ترخيصه بموجب ترخيص BSD.

ما هي حدود تعلم scikit في بايثون؟

Scikit-Learn هي أداة رائعة لاستكشاف البيانات وتحويلها وتصنيفها. لكنها مُحسّنة لتعلم الخوارزميات ، مثل آلات المتجهات الداعمة (SVM) والانحدار اللوجستي والتحليل التمييزي الخطي (LDA). لم يتم تحسينها لخوارزميات الرسم البياني ، وهي ليست جيدة جدًا في معالجة السلسلة. على سبيل المثال ، لا يوفر scikit-Learn طريقة مضمنة لإنشاء سحابة كلمات بسيطة. لا تمتلك Scikit-Learn مكتبة جبر خطية قوية ، وبالتالي يتم استخدام scipy و numpy. لا يحتوي على مكتبة للتخطيط ، ولكنه يسمح باستخدام مكتبات مختلفة للتخطيط.

هل يمكن استخدام Scikit للتعلم العميق؟

Scikit هي مجرد مجموعة من مكتبات قليلة. لذلك ، يمكن استخدام أي مكتبة فيه. يحظى التعلم العميق بشعبية كبيرة في السوق. تعد Keras و Theano أكثر أطر التعلم العميق شيوعًا في Python. إنها رائعة للبحث وتوفر أفضل أداء. ولكن بالنسبة للإنتاج ، يتعين علينا استخدام أدوات مثل TensorFlow و Caffe و DeepLearning4J. يوفر Scikit-Learn العديد من الأدوات مثل RandomForest و GradientBoosting و NeuralNet وما إلى ذلك والتي تعد مفيدة حقًا للمبتدئين. هذه أسهل في الكتابة وهي جيدة بما يكفي لمعظم حالات الاستخدام.