Pandas Dataframe Astype: بناء الجملة ، أنواع البيانات ، إنشاء إطار البيانات

نشرت: 2020-08-28

تعد Python واحدة من أكثر اللغات استخدامًا في مختلف الصناعات لأغراض معالجة البيانات وتحليلها. السبب الأكبر وراء شعبية Python هو مجموعتها الواسعة من المكتبات التي تجعل من السهل على المطورين الحفاظ على البيانات ومراقبتها. إحدى هذه المكتبات المكتوبة لبايثون هي Pandas . تُستخدم مكتبة Pandas ، على وجه الخصوص ، لمعالجة السلاسل الزمنية والجداول. تحقق من دورات علوم البيانات لدينا لمعرفة المزيد عن الباندا.

إطار بيانات الباندا . يتم استخدام طريقة astype () أو التي يشار إليها أحيانًا باسم astype () لإلقاء كائنات الباندا على نوع dtype. وظيفة astype (). إنه مفيد للغاية بشكل خاص عندما نحتاج إلى تحويل نوع البيانات لعمود واحد أو عدة أعمدة في جدول إلى آخر.

جدول المحتويات

بناء جملة Pandas DataFrame.astype ()

أولاً ، قبل مناقشة بناء الجملة ، نحتاج إلى استيراد مكتبة Pandas ، والتي تتم عن طريق:

استيراد الباندا كما pd

بناء جملة DataFrame. طريقة astype هي:

DataFrame.astype (نوع dtype ، نسخة = صحيح ، أخطاء = 'زيادة' ، ** kwargs)

حدود

وصف

القيمة الافتراضية

dtype

يستخدم numpy.dtype أو نوع Python لتحويل الكائن بأكمله إلى نفس النوع. يمكنه أيضًا بدلاً من ذلك استخدام {col: dtype،؟} حيث يكون العمود هو تسمية العمود ، وسيعمل dtype بنفس الطريقة لتوجيه واحد أو أكثر من أعمدة DataFrame إلى أنواع خاصة بالأعمدة.

dtype

ينسخ

إرجاع نسخة عند الضبط إلى True (يمكن أن يؤدي تعيين copy = false إلى نشر التغييرات في القيم إلى كائنات الباندا الأخرى ).

صحيح

أخطاء

يتحكم في رفع الاستثناءات على البيانات غير الصالحة لنوع dtype المحدد.

رفع

kwargs

وسيطات الكلمات الرئيسية لنقلها إلى المنشئ.

إرجاع : casted: إرجاع مشابه لنوع المتصل.

قراءة: إطارات البيانات في بايثون

أنواع البيانات في مكتبة الباندا

الآن منذ Pandas DataFrame. تتعلق طريقة astype () بصب أنواع البيانات وتغييرها في الجداول ، فلنلقِ نظرة على أنواع البيانات واستخدامها في مكتبة Pandas .

1. الكائن : يستخدم للقيم النصية أو الأبجدية الرقمية.

2. Int64 : يستخدم للأرقام الصحيحة.

3. Float64 : تستخدم لأرقام الفاصلة العائمة.

4. Bool : يُستخدم لقيم True / False.

5. Datetime64 : يستخدم لقيم التاريخ والوقت.

6. Timedelta [ns] : يستخدم للاختلافات بين تاريخين.

7. الفئة : تستخدم لقائمة من القيم النصية.

إنشاء DataFrame في مكتبة Pandas

هناك طريقتان لإنشاء إطار بيانات في كائن الباندا . يمكننا إما إنشاء جدول أو إدراج ملف CSV موجود. الكود الخاص بإدراج ملف موجود هو:

df = pd.read_csv (“ file_name.csv ”)

بناء الجملة لإنشاء جدول جديد لإطار البيانات هو:

ر = {'عمود 1': [1، 2]، 'عمود 2': [3، 4]}

df = pd.DataFrame (البيانات = t)

يجب أن تقرأ: دروس بايثون باندا للمبتدئين

استخدام طريقة Pandas Dataframe.astype ()

بمجرد إدراج الجدول وإطار البيانات في كائن الباندا ، يمكننا البدء في تحويل أنواع البيانات لعمود واحد أو أكثر من أعمدة الجدول. يمكننا التحقق من أنواع بيانات القيم قبل تحويلها باستخدام الكود df.dtypes أو df.info () . سيعرض كلا هذين الرمزين أنواع البيانات لكل عمود في الجدول.

شيء آخر يجب ملاحظته هو أن DataFrame. يمكن أن تعطي طريقة astype () خطأ إذا كان إطار البيانات يحتوي على قيم nan أو NA. لذا قبل المتابعة ، نحتاج إلى مسح جميع قيم النان من الجدول. بناء الجملة لإسقاط قيم nan أو NA هو:

df.dropna (inplace = صحيح)

تحويل كافة أعمدة إطار البيانات

النحو: df. astype (' data_type ') .dtypes

سيتم تحويل نوع بيانات إطار البيانات بالكامل إلى القيمة التي نضعها في " data_type. "

تحويل أعمدة معينة من إطار البيانات

النحو: df. astype ({“ col_name ”: ' data_type '}). dtypes

يتطلب "col_name" هنا اسم عمود كمدخل. مهما كان اسم العمود الذي نضعه ، سيتم تغيير نوع بيانات هذا العمود إلى القيمة التي نقدمها في " نوع_البيانات".

تحويل أعمدة متعددة في وقت واحد

النحو: df. astype ({“ col_name ”: 'data_type'، “ col_name ”: ' data_type '، “ col_name ”: ' data_type '}). dtypes

كل ما فعلناه هنا هو فصل جميع الأعمدة التي نريد تحويلها بفاصلة. يتطلب " col_name " و " data_type " في بناء الجملة نفس القيم المطلوبة أثناء تحويل عمود واحد.

تلخيصها

هذه هي الطريقة التي يستخدمها Pandas DataFrame. يتم استخدام طريقة astype (). تعد Python حاليًا واحدة من أكثر لغات البرمجة المفضلة لأنها وضعت قدمًا في التعلم الآلي وعلوم البيانات. إذا كنت تريد معرفة كيفية استخدام Python في هذين المجالين ، وكيف يمكن أن تساعدك في حياتك المهنية في علوم البيانات ، فيمكنك قراءة كل شيء عنها في مدونتنا. يمكنك زيارة موقع ويب Upgrad للحصول على برنامج PG تنفيذي في علوم البيانات أو شهادة PG في التعلم الآلي والتعمق

ما مدى صعوبة تعلم الباندا؟

Pandas هي حزمة Python ، لذلك ستحتاج إلى التعرف على أساسيات بناء جملة Python قبل البدء في استخدامها. قد تبدو البنية الأساسية للباندا غريبة في البداية ولكن مع الممارسة ، يمكنك تعلم أشياء مثل التجميع ، وتطبيق الوظائف على أي محور ، والتمحور. تم توسيع طبيعة Python متعددة الأغراض من خلال إنشاء مكتبة Pandas لمعالجة مشكلات التعلم الآلي أيضًا.

كيف يمكنني تثبيت أحدث إصدار من Pandas على جهاز الكمبيوتر؟

قم بتنزيل وتثبيت أحدث إصدار من Pip

2. قم بتنزيل أحدث إصدار من Python. لتجنب أي صعوبات في تثبيت Python الخاص بك ، انقر فوق خيار إلغاء تنشيط طول المسار بمجرد الانتهاء من تثبيت Python.

3. الآن وبعد تثبيت Python ، يجب عليك الانتقال إلى موجه الأوامر وتثبيت Pandas من هناك. لذا ، انتقل إلى مربع البحث على سطح المكتب واكتب "cmd" بداخله. يجب أن يظهر برنامج يسمى موجه الأوامر. للبدء ، ما عليك سوى النقر فوق الزر.

4. الآن ، أعط الأمر "pip install manager" في موجه الأوامر. انتظر حتى ينتهي التنزيل ، وبعد ذلك ستتمكن من تشغيل Pandas من داخل تطبيق Python الخاص بك.

ما هي حدود استخدام Pandas في Python؟

يمكن أن تكون بعض قواعد بناء جملة Pandas معقدة عند استخدام مستوياتها المتقدمة. هذه مشكلة لأن العديد من المستخدمين غير قادرين على التنقل بين كود Python القياسي و Pandas بطريقة فعالة وسلسة.

2. مع تقدمك وتعلم المزيد عن إطار عمل Pandas ، قد تجد بعض المفاهيم صعبة الفهم بعض الشيء.

3. لن تكون الباندا ذات فائدة تذكر بمجرد ترقية بياناتك إلى مصفوفة ثلاثية الأبعاد ، وستحتاج إلى الاعتماد على مكتبات أخرى مثل NumPy للحصول على المساعدة ، حيث أن Pandas لديها توافق ضعيف في مصفوفة ثلاثية الأبعاد.