أهم مشروعات التعلم الآلي في بايثون للمبتدئين [2022]

نشرت: 2021-01-03

إذا كنت تريد أن تصبح محترفًا في تعلم الآلة ، فسيتعين عليك اكتساب الخبرة باستخدام تقنياتها. أفضل طريقة للقيام بذلك هي من خلال استكمال المشاريع. لهذا السبب في هذه المقالة ، نشارك العديد من مشاريع التعلم الآلي في Python حتى تتمكن من البدء بسرعة في اختبار مهاراتك واكتساب خبرة قيمة.

ومع ذلك ، قبل أن تبدأ ، تأكد من أنك على دراية بالتعلم الآلي وخوارزميته. إذا لم تكن قد عملت في مشروع من قبل ، فلا تقلق لأننا شاركنا أيضًا برنامجًا تعليميًا مفصلاً حول مشروع واحد:

جدول المحتويات

مجموعة بيانات Iris: للمبتدئين

تعد مجموعة بيانات Iris بسهولة واحدة من أكثر مشاريع التعلم الآلي شيوعًا في Python. إنه صغير نسبيًا ، لكن بساطته وحجمه الصغير يجعلانه مثاليًا للمبتدئين. إذا لم تكن قد عملت في أي مشاريع للتعلم الآلي في Python ، فيجب أن تبدأ بها. مجموعة بيانات Iris عبارة عن مجموعة من أحجام زهرة السبل والبتلة من زهرة القزحية. يحتوي على ثلاث فئات ، مع 50 حالة في كل فئة.

لقد قدمنا ​​عينة من التعليمات البرمجية في أماكن مختلفة ، ولكن يجب ألا تستخدمها إلا لفهم كيفية عملها. إن تنفيذ الكود دون فهمه سيفشل في فرضية تنفيذ المشروع. لذا تأكد من فهم الكود جيدًا قبل تنفيذه.

الخطوة 1: استيراد المكتبات

تتمثل الخطوة الأولى في أي مشروع للتعلم الآلي في استيراد المكتبات. السبب الرئيسي وراء تعدد استخدامات Python هو مكتباتها القوية. المكتبات التي سنحتاجها في هذا المشروع هي:

  • الباندا
  • ماتبلوتليب
  • Sklearn
  • SciPy
  • نومبي

توجد طرق متعددة لاستيراد المكتبات إلى نظامك ، ويجب عليك استخدام طريقة معينة لاستيراد جميع المكتبات. سيضمن الاتساق ويساعدك على تجنب أي ارتباك. لاحظ أن التثبيت يختلف وفقًا لنظام تشغيل جهازك ، لذا ضع ذلك في الاعتبار أثناء استيراد المكتبات.

رمز:

# تحميل المكتبات

من استيراد الباندا read_csv

من pandas.plotting استيراد scatter_matrix

من matplotlib استيراد pyplot

من sklearn.model_selection استيراد train_test_split

من sklearn.model_selection استيراد cross_val_score

من sklearn.model_selection استيراد StratifiedKFold

من sklearn.metrics استيراد تصنيف_تقرير

من sklearn.metrics استيراد confusion_matrix

من sklearn.metrics دقة الاستيراد

من sklearn.linear_model استيراد LogisticRegression

من sklearn.tree استيراد DecisionTreeClassifier

من sklearn.neighbours استيراد KNeighboursClassifier

من sklearn.discriminant_analysis استيراد LinearDiscriminantAnalysis

من sklearn.naive_bayes استيراد GaussianNB

من sklearn.svm استيراد SVC

قراءة: أفضل 10 أفكار لمشاريع مجموعات بيانات التعلم الآلي للمبتدئين

الخطوة 2: قم بتحميل مجموعة البيانات

بعد استيراد المكتبات ، حان الوقت لتحميل مجموعة البيانات. كما ناقشنا ، سنستخدم مجموعة بيانات Iris في هذا المشروع. يمكنك تنزيله من هنا .

تأكد من تحديد أسماء كل عمود أثناء تحميل البيانات ، وسيساعدك ذلك لاحقًا في المشروع. نوصي بتنزيل مجموعة البيانات ، لذلك حتى إذا واجهت مشاكل في الاتصال ، فسيظل مشروعك غير متأثر.

رمز:

# تحميل مجموعة البيانات

url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv"

الأسماء = ['sepal-length'، 'sepal-width'، 'petal-length'، 'petal-width'، 'class']

مجموعة البيانات = read_csv (عنوان url ، الأسماء = الأسماء)

الخطوة 3: التلخيص

قبل أن نبدأ في استخدام مجموعة البيانات ، يجب أن ننظر أولاً إلى البيانات الموجودة فيها. سنبدأ بالتحقق من بُعد مجموعة البيانات ، والذي يوضح لنا أن مجموعة البيانات بها خمس سمات و 150 حالة.

بعد التحقق من البعد ، يجب أن تنظر إلى بعض الصفوف والأعمدة من مجموعة البيانات لتعطيك فكرة عامة عن محتواها. ثم يجب عليك إلقاء نظرة على الملخص الإحصائي لمجموعة البيانات ومعرفة المقاييس الأكثر انتشارًا في نفس المجموعة.

أخيرًا ، يجب عليك التحقق من توزيع الفصل في مجموعة البيانات. هذا يعني أنه سيتعين عليك التحقق من عدد الحالات التي تندرج تحت كل فئة. فيما يلي رمز لتلخيص مجموعة البيانات الخاصة بنا:

# تلخيص البيانات

من استيراد الباندا read_csv

# تحميل مجموعة البيانات

url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv"

الأسماء = ['sepal-length'، 'sepal-width'، 'petal-length'، 'petal-width'، 'class']

مجموعة البيانات = read_csv (عنوان url ، الأسماء = الأسماء)

# شكل

طباعة (dataset.shape)

# رئيس

print (dataset.head (20))

# أوصاف

طباعة (dataset.describe ())

توزيع # صنف

print (dataset.groupby ("class"). size ())

الخطوة 4: تصور البيانات

بعد تلخيص مجموعة البيانات ، يجب عليك تصورها لفهم وتحليل أفضل. يمكنك استخدام المخططات أحادية المتغير لتحليل كل سمة بالتفصيل والمخططات متعددة المتغيرات لدراسة علاقات كل ميزة. يعد تصور البيانات جانبًا مهمًا من مشاريع التعلم الآلي لأنه يساعد في العثور على المعلومات الأساسية الموجودة في مجموعة البيانات.

الخطوة 5: تقييم الخوارزمية

بعد تصور البيانات ، سنقوم بتقييم عدة خوارزميات للعثور على أفضل نموذج لمشروعنا. أولاً ، سننشئ مجموعة بيانات للتحقق والتي سنستخرجها من المجموعة الأصلية. ثم سنستخدم التحقق المتقاطع بمقدار 10 أضعاف وننشئ نماذج مختلفة. كما تمت مناقشته بالفعل ، فإننا نهدف إلى التنبؤ بالأنواع من خلال قياسات الأزهار. يجب عليك استخدام أنواع مختلفة من الخوارزميات واختيار النوع الذي يعطي أفضل النتائج. يمكنك اختبار SVM (آلات المتجهات الداعمة) و KNN (K-Nearest Neighbours) و LR (الانحدار اللوجستي) وغيرها.

في تطبيقنا ، وجدنا أن SVM هو أفضل نموذج. ها هو الكود:

من استيراد الباندا read_csv

من matplotlib استيراد pyplot

من sklearn.model_selection استيراد train_test_split

من sklearn.model_selection استيراد cross_val_score

من sklearn.model_selection استيراد StratifiedKFold

من sklearn.linear_model استيراد LogisticRegression

من sklearn.tree استيراد DecisionTreeClassifier

من sklearn.neighbours استيراد KNeighboursClassifier

من sklearn.discriminant_analysis استيراد LinearDiscriminantAnalysis

من sklearn.naive_bayes استيراد GaussianNB

من sklearn.svm استيراد SVC

# تحميل مجموعة البيانات

url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv"

الأسماء = ['sepal-length'، 'sepal-width'، 'petal-length'، 'petal-width'، 'class']

مجموعة البيانات = read_csv (عنوان url ، الأسماء = الأسماء)

# مجموعة بيانات التحقق من الانقسام

مجموعة = قيم مجموعة البيانات

X = مجموعة [:، 0: 4]

ص = مجموعة [: ، 4]

X_train، X_validation، Y_train، Y_validation = train_test_split (X، y، test_size = 0.20، random_state = 1، shuffle = True)

# خوارزميات فحص البقعة

النماذج = []

models.append (('LR'، LogisticRegression (solver = 'liblinear'، multi_class = 'ovr')))

models.append (('LDA'، LinearDiscriminantAnalysis ()))

models.append (('KNN'، KNeighboursClassifier ()))

models.append (('CART'، DecisionTreeClassifier ()))

models.append (('NB'، GaussianNB ()))

models.append (('SVM'، SVC (gamma = 'auto')))

# تقييم كل نموذج بدوره

النتائج = []

الأسماء = []

للاسم ، النموذج في النماذج:

kfold = StratifiedKFold (n_splits = 10 ، random_state = 1 ، خلط ورق اللعب = صحيح)

cv_results = cross_val_score (model، X_train، Y_train، cv = kfold، scoring = 'دقة')

results.append (cv_results)

names.append (name)

طباعة ('٪ s:٪ f (٪ f)'٪ (الاسم ، cv_results.mean () ، cv_results.std ()))

# قارن الخوارزميات

pyplot.boxplot (النتائج ، التسميات = الأسماء)

pyplot.title ("مقارنة الخوارزمية")

pyplot.show ()

الخطوة 6: توقع

بعد تقييم الخوارزميات المختلفة واختيار أفضلها ، حان الوقت للتنبؤ بالنتائج. سنستخدم نموذجنا في مجموعة بيانات التحقق أولاً لنرى اختبار دقته. بعد ذلك ، سنختبره على مجموعة البيانات بأكملها.

إليك رمز تشغيل نموذجنا على مجموعة البيانات:

# عمل تنبؤات

من استيراد الباندا read_csv

من sklearn.model_selection استيراد train_test_split

من sklearn.metrics استيراد تصنيف_تقرير

من sklearn.metrics استيراد confusion_matrix

من sklearn.metrics دقة الاستيراد

من sklearn.svm استيراد SVC

# تحميل مجموعة البيانات

url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv"

الأسماء = ['sepal-length'، 'sepal-width'، 'petal-length'، 'petal-width'، 'class']

مجموعة البيانات = read_csv (عنوان url ، الأسماء = الأسماء)

# مجموعة بيانات التحقق من الانقسام

مجموعة = قيم مجموعة البيانات

X = مجموعة [:، 0: 4]

ص = مجموعة [: ، 4]

X_train، X_validation، Y_train، Y_validation = train_test_split (X، y، test_size = 0.20، random_state = 1)

# قم بعمل تنبؤات حول مجموعة بيانات التحقق

الموديل = SVC (جاما = 'تلقائي')

model.fit (X_train، Y_train)

التنبؤات = model.predict (X_validation)

# تقييم التوقعات

طباعة (دقة_درجات (التحقق من صحة ، تنبؤات))

طباعة (confusion_matrix (Y_validation ، والتنبؤات))

طباعة (تصنيف_تقرير (Y_validation ، تنبؤات))

هذا هو. لقد أكملت الآن مشروع التعلم الآلي في Python باستخدام مجموعة بيانات Iris.

مشاريع تعلم الآلة الإضافية في بايثون

مجموعة بيانات Iris مخصصة بشكل أساسي للمبتدئين. إذا كان لديك بعض الخبرة في العمل على مشاريع التعلم الآلي في Python ، فيجب عليك إلقاء نظرة على المشاريع أدناه:

1. استخدم ML للتنبؤ بأسعار الأسهم

مكان ممتاز لتطبيق خوارزميات التعلم الآلي هو سوق الأسهم. تستخدم الشركات خوارزميات الذكاء الاصطناعي والتقنيات القائمة على ML لإجراء التحليل الفني لبعض الوقت الآن. يمكنك أيضًا إنشاء نموذج ML يتوقع أسعار الأسهم.

ومع ذلك ، للعمل في هذا المشروع ، سيتعين عليك استخدام العديد من التقنيات ، بما في ذلك تحليل الانحدار والتحليل التنبئي والنمذجة الإحصائية وتحليل الإجراءات. يمكنك الحصول على البيانات اللازمة من المواقع الرسمية للبورصات. يشاركون البيانات حول الأداء السابق للأسهم. يمكنك استخدام هذه البيانات لتدريب نموذجك واختباره.

كمبتدئ ، يمكنك التركيز على شركة معينة والتنبؤ بقيمة سهمها لمدة ثلاثة أشهر. وبالمثل ، إذا كنت ترغب في جعل المشروع صعبًا ، فيمكنك استخدام شركات متعددة وتوسيع الجداول الزمنية للتنبؤ.

ما الذي ستتعلمه من هذا المشروع:

سيجعلك هذا المشروع على دراية بتطبيقات الذكاء الاصطناعي والتعلم الآلي في صناعة التمويل. يمكنك أيضًا دراسة التحليل التنبئي من خلال هذا المشروع وتجربة خوارزميات مختلفة.

2. اكتب خوارزمية تعلم الآلة من الصفر

إذا كنت مبتدئًا ولم تعمل في أي من مشاريع التعلم الآلي في Python ، فيمكنك أيضًا البدء بهذا المشروع. في هذا المشروع ، عليك بناء خوارزمية ML من البداية. سيساعدك القيام بهذا المشروع على فهم جميع أساسيات وظائف الخوارزمية بينما يعلمك أيضًا تحويل الصيغ الرياضية إلى كود تعلم آلي.

إن معرفة كيفية تحويل المفاهيم الرياضية إلى كود ML أمر بالغ الأهمية ، حيث سيتعين عليك تنفيذه عدة مرات في المستقبل. نظرًا لأنك ستتعامل مع مشاكل أكثر تقدمًا ، فسيتعين عليك الاعتماد على هذه المهارة. يمكنك اختيار أي خوارزمية وفقًا لمعرفتك بمفاهيمها. سيكون من الأفضل أن تبدأ بخوارزمية بسيطة إذا كنت تفتقر إلى الخبرة.

ما الذي ستتعلمه من هذا المشروع:

ستتعرف على المفاهيم الرياضية للذكاء الاصطناعي والتعلم الآلي.

3. قم بإنشاء قارئ خط اليد

هذا هو مشروع رؤية الكمبيوتر. الرؤية الحاسوبية هي قطاع الذكاء الاصطناعي المتعلق بتحليل الصور. في هذا المشروع ، ستقوم بإنشاء نموذج ML يمكنه قراءة خط اليد. تعني القراءة أن النموذج يجب أن يكون قادرًا على التعرف على ما هو مكتوب على الورق. يجب عليك استخدام شبكة عصبية في هذا المشروع لتكون على دراية بالتعلم العميق والمفاهيم ذات الصلة.

سيتعين عليك أولاً معالجة الصورة مسبقًا وإزالة الأقسام غير الضرورية ؛ بمعنى آخر ، قم بتنظيف البيانات على الصورة من أجل الوضوح. بعد ذلك ، سيتعين عليك إجراء تجزئة للصورة وتغيير حجمها حتى تتمكن الخوارزمية من قراءة الأحرف بشكل صحيح. بمجرد الانتهاء من المعالجة المسبقة والتجزئة ، يمكنك الانتقال إلى الخطوة التالية ، التصنيف. ستميز خوارزمية التصنيف الأحرف الموجودة في النص وتضعها في فئاتها الخاصة.

يمكنك استخدام تنشيط السجل السيني لتدريب خوارزمية ML الخاصة بك لهذا المشروع.

ما الذي ستتعلمه من هذا المشروع:

ستتمكن من دراسة رؤية الكمبيوتر والشبكات العصبية. سيؤدي إكمال هذا المشروع أيضًا إلى جعلك على دراية بالتعرف على الصور وتحليلها.

4. توقع المبيعات

يحتوي قطاع البيع بالتجزئة على العديد من التطبيقات للذكاء الاصطناعي والتعلم الآلي. في هذا المشروع ، سوف تكتشف أحد هذه التطبيقات ، وهو التنبؤ بمبيعات المنتجات.

مجموعة البيانات السائدة بين المتحمسين للتعلم الآلي هي مجموعة بيانات مبيعات BigMart. لديها أكثر من 1559 منتجًا منتشرة في منافذها المختلفة في 10 مدن. يمكنك استخدام مجموعة البيانات لبناء نموذج انحدار. وفقًا للمنافذ ، يجب أن يتنبأ نموذجك بالمبيعات المحتملة لمنتجات معينة في العام المقبل. تحتوي مجموعة البيانات هذه على سمات محددة لكل منفذ ومنتج لفهم خصائصهم والعلاقة بين الاثنين بسرعة.

ما الذي ستتعلمه من هذا المشروع:

سوف يجعلك العمل في هذا المشروع على دراية بنماذج الانحدار والتحليل التنبئي. ستتعرف أيضًا على تطبيقات التعلم الآلي في قطاع البيع بالتجزئة.

تعرف على المزيد حول التعلم الآلي و Python

نأمل أن تكون قد وجدت هذه القائمة من مشاريع التعلم الآلي في Python مفيدة. إذا كان لديك أي أسئلة أو أفكار ، فيرجى إخبارنا من خلال قسم التعليقات. يسعدنا الرد على استفساراتك.

تعلم دورات علوم البيانات من أفضل الجامعات في العالم. اربح برامج PG التنفيذية أو برامج الشهادات المتقدمة أو برامج الماجستير لتتبع حياتك المهنية بشكل سريع.

فيما يلي بعض الموارد الإضافية لدراسة التعلم الآلي و Python.

  • دروس بايثون
  • تعلم الآلة مقابل. تعلم عميق
  • تطبيقات التعلم الآلي

من ناحية أخرى ، إذا كنت ترغب في الحصول على تجربة تعليمية أكثر تخصيصًا ، يمكنك الحصول على دورة تدريبية حول الذكاء الاصطناعي والتعلم الآلي. ستتعلم من خبراء الصناعة من خلال مقاطع الفيديو والتعيينات والمشاريع.

هل التعلم الآلي اختيار مهني جيد؟

إذا كنت مهتمًا بالتقنيات الناشئة والأخبار ذات الصلة ، فلا بد أنك سمعت بالفعل عن الثورة الصناعية الرابعة التي أحدثتها تقنية التعلم الآلي. وفقًا للتقارير ، من المتوقع أن تصل قيمة السوق العالمية للتعلم الآلي إلى 543 مليار روبية هندية بحلول عام 2023. ومع ذلك ، فقد زادت الفجوة في العرض والطلب لمتخصصي التعلم الآلي الأكفاء إلى ما يقرب من 125 في المائة. يشير هذا إلى أنه بالنسبة لمتخصص التعلم الآلي الذي يتمتع بمجموعة مناسبة من المهارات ، فإن سوق العمل يحمل الكثير من الوعود. سواء كنت تطمح إلى أن تصبح مهندسًا للتعلم الآلي ، أو مهندسًا بحثيًا ، أو عالم أبحاث ، فستكون بلا شك مهنة ثرية بالنسبة لك.

هل يمكن لحقيبة أحدث وظيفة التعلم الآلي؟

على الرغم من أن معظم وظائف التعلم الآلي تتطلب اليوم مهنيين ذوي خبرة ، إلا أن خيارات المبتدئين تتزايد أيضًا ، بسبب الطلب الهائل في السوق. قد يكون الأمر صعبًا بالنسبة للمبتدئين ، لكن من المؤكد أنه ليس من المستحيل الحصول على وظيفة تعلم الآلة. إذا كنت تستطيع إتقان المهارات المطلوبة ، والتخطيط لكيفية الأداء الجيد ، والتعلم بسرعة من اللاعبين ذوي الخبرة في الميدان ، يمكنك الحصول على وظيفة الأحلام هذه أيضًا. يمكنك التفكير في خيارات مثل الحصول على الشهادات ذات الصلة لإضافة المزيد من القيمة ، والاشتراك في دورات التعلم الآلي على منصات موثوقة ، وتجربة بعض المشاريع العملية ، ومتابعة أحدث الأخبار والاتجاهات التقنية ، والانضمام إلى المجتمعات عبر الإنترنت.

كم يكسب مهندس التعلم الآلي؟

يبلغ متوسط ​​الراتب الذي يجنيه مهندس التعلم الآلي في الهند حوالي 8.2 كهس روبية هندية سنويًا ، وفقًا لبيانات من glassdoor.in. الآن ، يعتمد متوسط ​​الدخل على عدة عوامل مثل المهارات والشهادات والخبرة والموقع والمزيد. ولكن مع المزيد من الخبرة في العمل ، يمكنك أن تتوقع زيادة أرباحك. على سبيل المثال ، يمكن أن يكسب كبار مهندسي التعلم الآلي في حدود 13 إلى 15 كهس روبية هندية في المتوسط.