كيفية بناء برنامج بايثون لتحليل المشاعر على تويتر؟ [برنامج تعليمي خطوة بخطوة]
نشرت: 2020-08-07مصدر
نظرًا لأن الشركات أصبحت تعتمد على البيانات بشكل متزايد ، فإن تقنية التعلم الآلي المسماة "تحليل المشاعر" تكتسب شعبية هائلة يومًا بعد يوم. يقوم بتحليل البيانات الرقمية / النصوص من خلال معالجة اللغة الطبيعية (NLP) للعثور على القطبية (إيجابية ، سلبية ، محايدة) ، المشاعر ، والعواطف (غاضب ، سعيد ، حزين ، إلخ) المعبر عنها في النص.
نظرًا لأن Twitter هو أحد أكثر المصادر شمولاً للمحادثات المباشرة والعامة في جميع أنحاء العالم ، فإن الشركات التجارية والمجموعات السياسية وما إلى ذلك مهتمة بإجراء "تحليل المشاعر" للتغريدات لفهم مشاعر / آراء السوق المستهدفة أو لدراسة سوق المنافسين . على الرغم من استعدادهم لاستخدام البرامج لهذا الغرض ولكن لتحقيق تنبؤات بمستوى عالٍ من الدقة ، خاصة بمعايير ومجالات معينة ، فإن أفضل طريقة هي إنشاء نموذج أو برنامج Python لتحليل مشاعر Twitter مخصص.
جدول المحتويات
برنامج تعليمي خطوة بخطوة: إنشاء برنامج تحليل المشاعر على Twitter باستخدام Python
يهدف هذا البرنامج التعليمي إلى إنشاء برنامج تحليل مشاعر Twitter باستخدام Python. يجب أن يكون البرنامج الناتج قادرًا على تحليل التغريدات التي يتم جلبها من Twitter وفهم مشاعر النص ، مثل قطبيته وذاتيته.
المكافآت
1. في المقام الأول هو المعرفة الأساسية للترميز / البرمجة في بايثون.
2. الأدوات التي سيتم تثبيتها على جهاز الكمبيوتر الخاص بك:

- بايثون
- المكتبات: Tweepy و text blob و word cloud و pandas و NumPy و matplotlib
(Tweepy هي مكتبة Python الرسمية لتويتر API التي تمكن Python من التواصل مع منصة Twitter)
3. حساب تويتر
4. يلزم إنشاء تطبيق Twitter والمصادقة عليه بواسطة Twitter: هذا ضروري للحصول على "مفتاح المستهلك ورموز الوصول" التي ستحتاجها في برمجتك.
إذا لم يكن لديك بالفعل تطبيق Twitter تم إنشاؤه لهذا الغرض ، فإليك كيفية إنشائه.
قراءة المزيد: برنامج تعليمي لـ Python NumPy: تعلم Python Numpy مع أمثلة
كيف أنشئ تطبيق تويتر؟
- انتقل إلى موقع مطور Twitter: dev.twitter.com.
- قم بتسجيل الدخول باستخدام حساب Twitter الخاص بك
- انتقل إلى "تطبيقاتي"
- انقر فوق "إنشاء تطبيق جديد".
- بعد ذلك ، تحتاج إلى ملء نموذج ، كما هو موضح أدناه.
مصدر
- بعد ذلك ، انقر فوق "إنشاء رمز الوصول الخاص بي".
- في الصفحة التالية ، حدد الخيار "قراءة وكتابة" ضمن العمود "نوع التطبيق".
سيتم تزويدك بإعدادات OAuth لتطبيق Twitter ، والتي تتضمن جميع التفاصيل الضرورية المتعلقة بمفتاح العميل الخاص بك ، وسر العميل ، ورمز الوصول ، وسر رمز الوصول ، وما إلى ذلك. تحتاج إلى تدوين هذه التفاصيل لأن بيانات اعتماد واجهة برمجة التطبيقات هذه ستمكنك من جلب التغريدات من تويتر. من الأفضل حفظه في ملف CSV على جهاز الكمبيوتر الخاص بك ، أخيرًا يمكنك تحميل ملف CSV مباشرةً في برنامجك لقراءة بيانات اعتماد API
ابدأ بإنشاء برنامج Python لتحليل المشاعر على Twitter
1. استيراد المكتبات : Tweepy و text blob و word cloud و pandas و NumPy و matplotlib
2. مصادقة تطبيق Twitter: بعد ذلك ، تحتاج إلى مصادقة تطبيق twitter الخاص بك باستخدام بيانات اعتماد إعدادات OAuth لتطبيق Twitter ، والتي يشار إليها أيضًا باسم بيانات اعتماد Twitter API. لهذا ، تحتاج إلى إنشاء كائن مصادقة ، باستخدام الرموز كما هو موضح في الصورة أدناه.
مصدر
لملء بيانات اعتماد Twitter API ، يمكنك إما تحميل ملف CSV أو نسخ بيانات الاعتماد يدويًا ولصقها.
3. جلب التغريدات من مستخدم Twitter: الآن ، لجلب التغريدات ، تحتاج أولاً إلى اختيار مستخدم Twitter الذي تريد تحليل تغريداته لفهم المشاعر المعبر عنها فيها. دعنا نقول؛ تريد معرفة ما إذا كانت تغريدات "UserXYZ" إيجابية أو سلبية أو محايدة من خلال إجراء تحليل المشاعر لـ 100 تغريدة بواسطة UserXYZ.
كود لجلب التغريدات
posts = api.user_timeline (screen_name = ”UserXYZ”، count = 100، Lang = ”en”، tweet_mode = “extended”)
سيؤدي تشغيل الأمر أعلاه إلى إظهار التغريدات.
4. إنشاء إطار بيانات: الآن ، تحتاج إلى إنشاء إطار بيانات للتغريدات التي جلبتها. لنفترض أنك قمت بتسمية العمود الأول من df باسم "تغريدات" ، وسوف يحتوي على جميع التغريدات المنتشرة عبر 100 صف نظرًا لأنك تقوم بتحليل 100 تغريدة.
Df = pd.dataframe ([tweet.full_text للتغريد في المشاركات] ، الأعمدة = ['Tweet'])
5. تنظيف النص: يعد تنظيف نص التغريدات أمرًا مهمًا لنجاح برنامج بايثون لتحليل المشاعر على تويتر ، حيث سيكون هناك العديد من الرموز غير المرغوب فيها مثل @ ، # ، إعادة التغريدات ، الارتباطات التشعبية في عناوين URL ، وما إلى ذلك. مكتبة python '' قيد الاستخدام.
احصل على الموضوعية والقطبية: بمجرد تنظيف النص ، تحتاج إلى إنشاء وظيفتين باستخدام مكتبة TextBlob python للحصول على موضوعية وقطبية التغريدات. تُظهر الذاتية مدى رأي النص ، وتصف القطبية الإيجابية أو السلبية في النص. سيكون من الأفضل كتابة نص بيثون لإنشاء عمودين آخرين في إطار البيانات الخاص بك لاستضافة الموضوعية والقطبية. لذلك ، سيتكون إطار بياناتك الآن من ثلاثة أعمدة (الأول للتغريدات ، والثاني للذات ، والثالث للقطبية)

رموز إنشاء وظائف الذاتية والقطبية هي كما يلي:
مصدر
بعد تشغيل الكود ، سترى درجات الذاتية والقطبية لكل تغريدة معروضة في الأعمدة المعنية. يصف TextBlob القطبية ضمن مقياس من 1 إلى -1. لذلك ، إذا كانت التغريدة ذات قطبية -0.4 تعني أنها سلبية بعض الشيء ، وإذا كانت تحتوي على 0.6 ذاتية ، فهي ذاتية إلى حد ما.
6. بعد ذلك ، يمكنك اختيار تضمين سحابة الكلمات في برنامج Python لتحليل المشاعر على Twitter ، حيث أن سحابة الكلمات شائعة أيضًا باعتبارها تقنية تصور البيانات المستخدمة لتحليل المشاعر ، حيث يشير حجم الكلمات إلى أهميتها.
مثال على WordCloud:
مصدر
مكتبات matplotlib و Pandas و WordCloud ستدخل حيز التنفيذ الذي قمت باستيراده بالفعل. لرسم سحابة كلمة أولاً ، تحتاج إلى إنشاء متغير ؛ دعنا نسميها "allwords" لتمثيل جميع التغريدات في عمود "التغريدات" في إطار البيانات.
كود لإنشاء WordCloud
allwords = ". الانضمام ([twts لـ twts في df ['تغريدات']])
WordCloud = WordCloud (العرض = xxx ، الارتفاع = xxx ، randon_state = xxx ، max_font_size = xxx. إنشاء (جميع الكلمات)
plt.imshow (wordcloud)
plt.axis ("off")
plt.show ()
7. نظرًا لوجود درجات القطبية لكل تغريدة ، يمكنك البدء في حساب التحليل الإيجابي والسلبي والمحايد للتغريدات. لهذا ، تحتاج إلى إنشاء دالة ، دعنا نسميها "تحليل" ، حيث يمكنك تعيين النتيجة 0 إلى محايد ، و <0 إلى سلبي ، و> 0 إلى إيجابي.
تحليل المواطنة (النتيجة):
إذا كانت النتيجة <0
إرجاع "سلبي".
نقاط elif == 0
العودة "محايدة
آخر،
العودة "إيجابية".
بعد ذلك ، لاستضافة نتائج تحليل المشاعر للتغريدات ، قم بإنشاء عمود جديد في إطار البيانات الخاص بك ، دعنا نسميه "TwtAnalysis" ثم اكتب الكود التالي:
df ['TwtAnalysis'] = df ['قطبية']. تطبيق (تحليل)
8. سيحتوي إطار البيانات الجديد على العمود المضاف المسمى "TwtAnalysis" ، وسيشير إلى كل تغريدة إما على أنها إيجابية أو سلبية أو محايدة بناءً على درجة القطبية الخاصة بها. يظهر المثال أدناه في الصورة:
مصدر

9. بمجرد تصنيف التغريدات على أنها إيجابية وسلبية ومحايدة ، يمكنك الاستمرار في بناء برنامج Python لتحليل المشاعر على Twitter . لتمثيل البيانات بتنسيقات مختلفة مثل:
- احصل على النسبة المئوية للتغريدات الإيجابية أو السلبية أو المحايدة.
- اطبع كل التعليقات الإيجابية أو التغريدات السلبية أو المحايدة بشكل منفصل
- أنشئ مخططًا مرئيًا لتحليل المشاعر للتغريدات الإيجابية والسلبية والحيادية وغير ذلك الكثير.
اقرأ أيضًا: أفضل 9 مكتبات Python لتعلم الآلة
خاتمة
شرح برنامج Python لتحليل المشاعر على تويتر بلغة هذه المقالة هي واحدة فقط طريقة لإنشاء مثل هذا البرنامج. يمكن للمطور تخصيص البرنامج بعدة طرق لمطابقة المواصفات لتحقيق أقصى درجات الدقة في قراءة البيانات ، أي جمال برمجته من خلال Python ، وهي لغة رائعة ، يدعمها مجتمع نشط من المطورين والعديد من المكتبات.
تمتلك Python نطاقًا هائلاً في مجال التعلم الآلي وعلوم البيانات. أولئك الذين يعملون في البرمجة لفترة من الوقت يعرفون جيدًا أن التعلم الآلي سيستمر في كونه أحد الإنجازات في مستقبل البرمجة.
إذا كنت ترغب في الحصول على تجربة تعليمية شاملة ومنظمة ، وأيضًا إذا كنت مهتمًا بمعرفة المزيد عن التعلم الآلي ، فراجع IIIT-B & upGrad's دبلوم PG في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويوفر أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، وحالة خريجي IIIT-B ، وأكثر من 5 مشاريع تتويجا عملية عملية ومساعدة وظيفية مع كبرى الشركات.
ما هي الأهمية الوظيفية لتحليل المشاعر على وسائل التواصل الاجتماعي؟
في عصر وسائل التواصل الاجتماعي ، تتمتع آراء المستهلكين بقوة لا نهائية لإنشاء علامة تجارية أو كسرها. تحليل المشاعر هو أفضل طريقة لفهم العوامل الدافعة وراء آراء المستهلكين وعواطفهم بدقة. من خلال البيانات المتاحة من تحليل المشاعر ، يمكن للشركات العثور على جمهورها المستهدف ، وتحديد المؤثرين على وسائل التواصل الاجتماعي لعلامتهم التجارية ، وتحديد اتجاهات الأسواق الناشئة. علاوة على ذلك ، يقدم تحليل المشاعر على منصات وسائل التواصل الاجتماعي أيضًا فكرة شاملة عن صحة علامتهم التجارية ؛ يمكن للشركات تلقي تعليقات صادقة للمستهلكين حول المنتجات والخدمات التي تم إطلاقها حديثًا لتحسينها. كما أنها فعالة في التعامل مع السمعة عبر الإنترنت من خلال تحديد نطاقات التحسين وحل المشكلات بشكل أفضل.
هل يمكنك تعلم بايثون بنفسك؟
إذا كان لديك مستوى معين من الخبرة في البرمجة ، يمكنك بالتأكيد البدء في تعلم Python بنفسك. تأتي Python ببنية نحوية بسيطة نسبيًا وهي أيضًا بديهية ، مما يسهل فهمها حتى للمبتدئين. علاوة على ذلك ، من السهل تثبيت الحزمة وتنفيذها على جهازك من أي مكان. يمكنك تسريع تعلمك من خلال التسجيل في دورات بايثون وحضور معسكرات تدريب البرمجة. من خلال مجتمع مطور نشط مستعد دائمًا لتقديم الدعم ، ووفرة موارد التعلم والوثائق ، يمكن للمبتدئين تعلم أساسيات Python في حوالي 7-8 أسابيع.
أيهما أكثر صعوبة في التعلم بين Python و C ++؟
تعد Python و C ++ لغتي برمجة مختلفتين تمامًا مع سلوك وميزات مختلفة تمامًا. ومع ذلك ، كلاهما يدعم بقوة البرمجة الشيئية. ولكن بالنظر إلى إطار عمل Python العام ، يكون التعلم مباشرًا ، وأسهل بكثير ، وأسرع من تعلم C ++. في الواقع ، يتعلم الكثير من الناس لغة بايثون لتجربة ما يبدو عليه الترميز البسيط. Python مفتوحة المصدر ومجانية وتوفر موثوقية هائلة وسهولة عندما يتعلق الأمر بتطوير تطبيقات التعلم الآلي المعقدة. في حين أن C ++ أكثر كفاءة من حيث الأداء ، إلا أنها لا تعتبر مناسبة على Python لمشاريع التعلم الآلي.