أهم مكتبات التصور لبيانات Python التي يجب أن تعرفها

نشرت: 2020-03-20

يمكن لبايثون أن تفعل أشياء كثيرة بالبيانات. وإحدى إمكانياتها العديدة هي التخيل. لديها مكتبات متعددة يمكنك استخدامها لهذا الغرض. في هذه المقالة ، سنلقي نظرة على بعض مكتباتها البارزة والرسوم البيانية المختلفة التي يمكنك رسمها من خلالها.

جدول المحتويات

تصور بيانات بايثون

لقد شاركنا أمثلة متعددة في هذه المقالة ، تأكد من تجربتها باستخدام مجموعة بيانات. هيا بنا نبدأ:

مكتبات التصور لبيانات بايثون

يوجد في Python العديد من المكتبات لإنشاء رسوم بيانية جميلة. لديهم جميعًا ميزات متنوعة تعزز أدائهم وقدراتهم. وهي متاحة لجميع مستويات المهارة. هذا يعني أنه يمكنك إجراء تصور للبيانات في Python ، سواء كنت مبتدئًا أو مبرمجًا متقدمًا. فيما يلي بعض المكتبات البارزة:

  • بحار
  • ماتبلوتليب
  • الباندا

هناك العديد من مكتبات Python الأخرى لعلوم البيانات ، لكننا ركزنا على المكتبات البارزة في الوقت الحالي. سنناقش الآن هذه المكتبات المختلفة ونفهم كيف يمكنك رسم الرسوم البيانية باستخدامها و Python. هيا بنا نبدأ.

ماتبلوتليب

مكتبة Python الأكثر شهرة لتخطيط الرسوم البيانية هي Matplotlib. لا يتطلب الكثير من الخبرة ، وبالنسبة للمبتدئين ، فهو مثالي. يمكنك البدء في تعلم تصور البيانات من خلال هذه المكتبة وإتقان مجموعة متنوعة من الرسوم البيانية والتصورات. يمنحك الكثير من الحرية ، ولكن عليك كتابة الكثير من التعليمات البرمجية أيضًا.

يستخدم الناس Matplotlib لتصورات بسيطة مثل المخططات الشريطية والرسوم البيانية.

قراءة : إطارات البيانات في بايثون

خط الرسم البياني

لإنشاء مخطط خطي ، ستحتاج إلى استخدام طريقة "الرسم". من خلال تكرار الأعمدة ، يمكنك إنشاء عدة أعمدة في الرسم البياني الخاص بك. استخدم الكود التالي لهذا الغرض:

# احصل على أعمدة لرسمها

الأعمدة = iris.columns.drop (['class'])

# إنشاء بيانات x

x_data = النطاق (0، iris.shape [0])

# إنشاء الشكل والمحور

الشكل ، الفأس = plt.subplots ()

# ارسم كل عمود

للعمود في الأعمدة:

ax.plot (x_data ، قزحية [عمود] ، تسمية = عمود)

# تعيين العنوان والأسطورة

ax.set_title ("مجموعة بيانات Iris")

ax.legend ()

مؤامرة مبعثر

يمكنك إنشاء مخطط مبعثر باستخدام طريقة "التبعثر". يجب عليك إنشاء محور وشكل من خلال "plt.subplots" لإعطاء تسميات المؤامرة الخاصة بك والعنوان.

استخدم الكود التالي:

# إنشاء شكل ومحور

الشكل ، الفأس = plt.subplots ()

# مبعثر sepal_length مقابل عرض sepal_width

مبعثر ax. (iris ['sepal_length']، iris ['sepal_width'])

# تعيين العنوان والتسميات

ax.set_title ("مجموعة بيانات Iris")

ax.set_xlabel ('sepal_length')

ax.set_ylabel ('sepal_width')

يمكنك إضافة لون إلى نقاط البيانات وفقًا لفئاتها. لهذا الغرض ، ستحتاج إلى إنشاء قاموس يمكن تعيينه من فصل دراسي إلى لون. ستشتت كل نقطة باستخدام حلقة for-loop أيضًا.

# إنشاء قاموس الألوان

الألوان = {'Iris-setosa': 'r'، 'Iris-versicolor': 'g'، 'Iris-virginica': 'b'}

# إنشاء شكل ومحور

الشكل ، الفأس = plt.subplots ()

# ارسم كل نقطة بيانات

بالنسبة لـ i في النطاق (len (iris ['sepal_length'])):

ax.scatter (iris ['sepal_length'] [i]، iris ['sepal_width'] [i]، color = colours [iris ['class'] [i]])

# تعيين العنوان والتسميات

ax.set_title ("مجموعة بيانات Iris")

ax.set_xlabel ('sepal_length')

ax.set_ylabel ('sepal_width')

الرسم البياني

يمكنك استخدام طريقة "هيست" لإنشاء مدرج تكراري في Matplotlib. يمكنه حساب عدد مرات حدوث كل فئة إذا قدمنا ​​لها بيانات فئوية. إليك الكود الذي ستحتاج إلى استخدامه لرسم مخطط بياني في Matplotlib:

# إنشاء الشكل والمحور

الشكل ، الفأس = plt.subplots ()

# رسم بياني مؤامرة

ax.hist (wine_reviews ['نقاط'])

# تعيين العنوان والتسميات

ax.set_title ("درجات مراجعة النبيذ")

ax.set_xlabel ("النقاط")

ax.set_ylabel ("التردد")

شريط الرسم البياني

لدى Matplotlib طرق سهلة لرسم الرسوم البيانية المختلفة. على سبيل المثال ، في هذه الحالة ، لإنشاء مخطط شريطي في Matplotlib ، ستحتاج إلى استخدام "شريط". لا يمكنه حساب تكرار الفئات تلقائيًا ، لذلك ستحتاج إلى استخدام وظيفة "value_counts" لحل هذه المشكلة. إذا لم يكن لبياناتك أنواع كثيرة ، فسيكون المخطط الشريطي مثاليًا لتصورها.

# إنشاء شكل ومحور

الشكل ، الفأس = plt.subplots ()

# احسب حدوث كل فئة

data = wine_reviews ['Points']. value_counts ()

# الحصول على بيانات س وص

النقاط = مؤشر البيانات

التردد = قيم البيانات

# إنشاء مخطط شريطي

ax.bar (النقاط ، التردد)

# تعيين العنوان والتسميات

ax.set_title ("درجات مراجعة النبيذ")

ax.set_xlabel ("النقاط")

ax.set_ylabel ("التردد")

الباندا

Pandas هي مكتبة لغة Python تشتهر بتحليل البيانات ومعالجتها. إنها مكتبة مفتوحة المصدر لذا يمكنك استخدامها مجانًا. دخلت السوق في عام 2008 ، ومنذ ذلك الحين ، أصبحت واحدة من أكثر المكتبات شعبية لهيكلة البيانات.

باستخدام إطار بيانات الباندا ، يمكنك بسهولة إنشاء مخططات لبياناتك. API الخاص به أكثر تقدمًا من Matplotlib. هذا يعني أنه يمكنك إنشاء رسوم بيانية برمز أقل في Pandas مما تفعله في Matplotlib.

شريط الرسم البياني

في Pandas ، ستحتاج إلى استخدام طريقة "plot.bar ()" لرسم مخطط شريطي. أولاً ، ستحتاج إلى حساب الأحداث في مخططك من خلال "value_count ()" ثم فرزها باستخدام "sort_index ()". فيما يلي مثال على رمز لإنشاء مخطط شريطي:

random_reviews ['Points']. value_counts (). sort_index (). plot.bar ()

يمكنك استخدام طريقة "plot.barh ()" لإنشاء مخطط شريطي أفقي في Pandas:

random_reviews ['Points']. value_counts (). sort_index (). plot.barh ()

يمكنك رسم البيانات من خلال عدد التكرارات أيضًا:

random_reviews.groupby ("country"). price.mean (). sort_values ​​(تصاعدي = خطأ) [: 5] .plot.bar ()

خط الرسم البياني

ستحتاج إلى استخدام "<dataframe> .plot.line ()" لإنشاء مخطط خطي في Pandas ، في Pandas ، لن تحتاج إلى تكرار كل عمود تريد رسمه لأنه يمكنه القيام بذلك تلقائيًا. هذه الميزة غير متوفرة في Matplotlib. ها هو الكود:

random.drop (['class'] ، المحور = 1) .plot.line (العنوان = "مجموعة البيانات العشوائية")

مؤامرة مبعثر

يمكنك إنشاء مخطط مبعثر في Pandas باستخدام “<dataset> .plot.scatter ()”. ستحتاج إلى تمرير وسيطتين ، وهما أسماء العمود x والعمود y.

هذا مثاله:

random.plot.scatter (x = 'sepal_length' ، y = 'sepal_width' ، العنوان = "Random Dataset ')

الرسم البياني

استخدم "plot.hist" لإنشاء مدرج تكراري في Pandas. بصرف النظر عن ذلك ، لا يوجد الكثير في هذه الطريقة. لديك خيار إنشاء مدرج تكراري واحد أو مدرج تكراري متعدد.

لإنشاء مدرج تكراري واحد ، استخدم الكود التالي:

random_reviews ['Points']. plot.hist ()

لإنشاء مدرج تكراري متعدد ، استخدم هذا:

عشوائي.plot.hist (الحبكات الفرعية = صحيح ، التخطيط = (2،2) ، حجم التين = (10 ، 10) ، الصناديق = 20)

بحار

يعتمد Seaborn على Matplotlib وهو أيضًا مكتبة Python شائعة جدًا لتصور البيانات. يمنحك واجهات متقدمة لرسم بياناتك. لديها العديد من الميزات. تتيح لك إمكانياتها المتقدمة إنشاء رسوم بيانية رائعة تحتوي على عدد أقل بكثير من سطور التعليمات البرمجية أكثر مما تحتاجه باستخدام Matplotlib.

الرسم البياني

خط الرسم البياني

يمكنك استخدام طريقة 'sns.line plot' لإنشاء مخطط خطي في Seaborn. يمكنك استخدام طريقة "sns.kdeplot" لتقريب حواف منحنيات الخطوط. إنها تحافظ على قطعة الأرض الخاصة بك نظيفة تمامًا إذا كانت بها الكثير من القيم المتطرفة.

sns.lineplot (data = random.drop (['class'] ، محور = 1))

مؤامرة مبعثر

في Seaborn ، يمكنك إنشاء مخطط تبعثر من خلال طريقة ". scatterplot". ستحتاج إلى إضافة أسماء العمودين x و y في هذه الحالة ، تمامًا كما فعلنا مع Pandas. لكن هناك فرق. لا يمكننا استدعاء الدالة على البيانات كما فعلنا في Pandas ، لذا سنحتاج إلى تمريرها كوسيطة إضافية.

sns.scatterplot (x = 'sepal_length'، y = 'sepal_width'، data = iris)

باستخدام وسيطة "hue" ، يمكنك إبراز نقاط محددة أيضًا. هذه الميزة ليست بهذه السهولة في Matplotlib.

sns.scatterplot (x = 'sepal_length' ، y = 'sepal_width' ، hue = 'class' ، data = iris)

شريط الرسم البياني

يمكنك استخدام طريقة "sns.countplot" لإنشاء مخطط شريطي في Seaborn:

sns.countplot (التعليقات العشوائية ['النقاط'])

الآن بعد أن ناقشنا المكتبات الهامة لتصور البيانات في Python ، يمكننا إلقاء نظرة على أشكال أخرى من الرسوم البيانية. تمكنك Python ومكتباتها من إنشاء أنواع مختلفة من الأشكال لرسم بياناتك.

أنواع أخرى من تصور البيانات في بايثون

مخطط دائري

تعرض المخططات الدائرية البيانات في أقسام مختلفة من الدائرة. لابد أنك رأيت الكثير من المخططات الدائرية في المدرسة. المخططات الدائرية تمثل البيانات بالنسب المئوية. يجب أن يكون المجموع الإجمالي لجميع أجزاء المخطط الدائري مساويًا لـ 100٪. هذا هو رمز المثال:

plt.pie (df ['Age'] ، labels = {"A" ، "B" ، "C" ،

"D" ، "E" ، "F" ،

"G" ، "H" ، "I" ، "J"} ،

autopct = '٪ 1.1f ٪٪' ، الظل = صحيح)

plt.show ()

plt.pie (df ['Income'] ، labels = {"A" ، "B" ، "C" ،

"D" ، "E" ، "F" ،

"G" ، "H" ، "I" ، "J"} ،

autopct = '٪ 1.1f ٪٪' ، الظل = صحيح)

plt.show ()

plt.pie (df ['Sales'] ، labels = {"A" ، "B" ، "C" ،

"D" ، "E" ، "F" ،

"G" ، "H" ، "I" ، "J"} ،

autopct = '٪ 1.1f ٪٪' ، الظل = صحيح)

plt.show ()

قطع مربع

تعتمد مخططات الصندوق على الحد الأدنى ، والربيع الأول ، والمتوسط ​​، والربيع الثالث ، والحد الأقصى للبيانات الإحصائية. يبدو الرسم البياني كصندوق (بشكل أكثر تحديدًا ، مستطيل). لهذا السبب يحمل اسم "مؤامرة الصندوق". فيما يلي مثال على الكود لإنشاء رسم بياني للمربع:

# لكل سمة رقمية لإطار البيانات

df.plot.box ()

# مؤامرة مربع سمة فردية

plt.boxplot (df ["الدخل"])

plt.show ()

اقرأ أيضًا: أفضل 10 أدوات للبايثون يجب أن يعرفها كل مطور لغة بايثون

خاتمة

نأمل أن تكون قد وجدت هذه المقالة مفيدة. هناك العديد من أنواع الرسوم البيانية التي يمكنك رسمها من خلال Python ومكتباتها المختلفة. إذا لم تكن قد قمت بإجراء تصور بيانات Python من قبل ، فيجب أن تبدأ بـ Matplotlib. بعد إتقانها ، يمكنك الانتقال إلى مكتبات تصور البيانات الأكثر تعقيدًا وتقدماً مثل Pandas و Seaborn.

إذا كنت مهتمًا بالتعرف على Python وعلوم البيانات ، فراجع IIIT-B & upGrad's دبلوم PG في علوم البيانات الذي تم إنشاؤه للمهنيين العاملين ويقدم أكثر من 10 دراسات حالة ومشاريع ، وورش عمل عملية عملية ، وإرشاد مع خبراء الصناعة ، وجهاً لوجه مع مرشدين في هذا المجال ، وأكثر من 400 ساعة من التعلم والمساعدة في العمل مع الشركات الكبرى.

ما هي أفضل مكتبات تصور البيانات في Python؟

يعتبر تصور البيانات جزءًا مهمًا للغاية من تحليل البيانات. هذا لأنه لا توجد طريقة أفضل من فهم العديد من اتجاهات البيانات والمعلومات في تنسيق مرئي. إذا قدمت بيانات شركتك بتنسيق مكتوب ، فقد يجدها الناس مملة. ولكن ، إذا قمت بتقديم نفس الشيء في شكل مرئي ، فمن المؤكد أن الناس سوف ينتبهون إليه بشكل أكبر.

لتبسيط عملية تصور البيانات ، توجد مكتبات معينة في Python لمساعدتك في ذلك. لا يمكنك أن تقول أن أي شخص معين هو الأفضل لأن ذلك سيعتمد تمامًا على المتطلبات. بعض من أفضل مكتبات تصور البيانات في Python هي matplotlib و plotly و seaborn و GGplot و altair.

ما هي واحدة من أفضل مكتبات التخطيط في بايثون؟

هناك الكثير منهم لتسهيل العمل بالنسبة لك عندما يتعلق الأمر بتصور البيانات وتخطيط المكتبات. لقد لوحظ أنه من بين جميع المكتبات المتاحة ، تعتبر Matplotlib أفضل من قبل المستخدمين.

تحتل Matplotlib مساحة أقل ولديها أيضًا وقت تشغيل أفضل. بخلاف ذلك ، فإنه يوفر أيضًا واجهة برمجة تطبيقات موجهة للكائنات تتيح للمستخدمين رسم الرسوم البيانية في التطبيق نفسه. يدعم Matplotlib أيضًا الكثير من أنواع الإخراج ، إلى جانب كونها مجانية ومفتوحة المصدر.

ما هي مكتبة تصور البيانات الافتراضية لعلماء البيانات؟

إذا كنت تعمل في علم البيانات ، فهناك فرص كبيرة لاستخدام مكتبة Matplotlib بالفعل. لقد لوحظ أن المبتدئين إلى المحترفين ذوي الخبرة يفضلون استخدام هذه المكتبة لبناء تصورات البيانات المعقدة.

السبب الرئيسي وراء اعتبارها الكبير هو مقدار المرونة التي توفرها للمستخدمين كمكتبة للتخطيط ثنائي الأبعاد. إذا كانت لديك خلفية MATLAB ، فستتمكن من ملاحظة أن واجهة Pyplot الخاصة بـ Matplotlib مألوفة لك تمامًا. لذلك ، لن تحتاج إلى الكثير من الوقت للبدء بالتخيل الأول. يحصل المستخدم على التحكم في التصور الكامل في Matplotlib من المستوى الأكثر دقة.