Pandas Dataframe Astype: ไวยากรณ์, ประเภทข้อมูล, การสร้าง Dataframe
เผยแพร่แล้ว: 2020-08-28Python เป็นหนึ่งในภาษาที่ใช้กันมากที่สุดในอุตสาหกรรมต่างๆ เพื่อวัตถุประสงค์ในการจัดการและวิเคราะห์ข้อมูล เหตุผลที่ใหญ่ที่สุดที่อยู่เบื้องหลังความนิยมของ Python ก็คือชุดไลบรารีขนาดใหญ่ที่ทำให้นักพัฒนาสามารถดูแลรักษาและตรวจสอบข้อมูลได้ง่าย ไล บรารี่ หนึ่งที่เขียนขึ้นสำหรับ Python คือ Pandas โดย เฉพาะอย่างยิ่ง ห้องสมุด Pandas ใช้สำหรับจัดการอนุกรมเวลาและตาราง ชำระเงินหลักสูตรวิทยาศาสตร์ข้อมูลของเราเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับแพนด้า
ดาต้าเฟรม ของ แพนด้า astype () หรือบางครั้งเรียกว่า astype () วิธีการใช้เพื่อส่ง วัตถุ แพนด้า ไปยัง dtype ฟังก์ชัน astype () มีประโยชน์มากโดยเฉพาะเมื่อเราต้องการแปลงชนิดข้อมูลของคอลัมน์หนึ่งหรือหลายคอลัมน์ของตารางเป็นอีกคอลัมน์หนึ่ง
สารบัญ
ไวยากรณ์ของ Pandas DataFrame.astype()
ประการแรก ก่อนพูดคุยเกี่ยวกับไวยากรณ์ เราต้องนำเข้าไลบรารี Pandas ซึ่งทำโดย:
นำเข้าแพนด้าเป็น pd
ไวยากรณ์สำหรับ DataFrame astype () วิธีคือ:
DataFrame.astype(dtype, copy=True, ข้อผิดพลาด='raise', **kwargs)
พารามิเตอร์
คำอธิบาย
ค่าเริ่มต้น
dtype
ใช้ numpy.dtype หรือประเภท Python เพื่อส่งวัตถุทั้งหมดให้เป็นประเภทเดียวกัน นอกจากนี้ยังสามารถใช้ {col: dtype, ?} โดยที่ col คือป้ายกำกับคอลัมน์ และ dtype จะทำงานเหมือนกันเพื่อส่งคอลัมน์ของ DataFrame หนึ่งคอลัมน์ขึ้นไปเป็นประเภทเฉพาะคอลัมน์
dtype
สำเนา
ส่งกลับสำเนาเมื่อตั้งค่าเป็น True (การตั้งค่า copy=false สามารถเผยแพร่การเปลี่ยนแปลงค่าไปยัง วัตถุ แพนด้า อื่น ๆ ได้)
จริง
ข้อผิดพลาด
ควบคุมข้อยกเว้นที่เกิดจากข้อมูลที่ไม่ถูกต้องสำหรับ dtype ที่กำหนด
ยก
kwargs
อาร์กิวเมนต์ของคีย์เวิร์ดเพื่อส่งต่อไปยังคอนสตรัคเตอร์
Returns : casted: return คล้ายกับประเภทของผู้โทร
อ่าน: Data Frames ใน Python
ประเภทข้อมูลในห้องสมุด Pandas
ตั้งแต่ Pandas DataFrame วิธี astype () เกี่ยวกับการแคสต์และเปลี่ยนประเภทข้อมูลในตาราง มาดูประเภทข้อมูลและการใช้งานใน ไลบรารี Pandas
1. วัตถุ : ใช้สำหรับค่าข้อความหรือตัวเลขและตัวอักษร
2. Int64 : ใช้สำหรับตัวเลขจำนวนเต็ม
3. โฟลต64 : ใช้สำหรับเลขทศนิยม
4. Bool : ใช้สำหรับค่า True/False
5. Datetime64 : ใช้สำหรับค่าวันที่และเวลา
6. Timedelta[ns] : ใช้สำหรับความแตกต่างระหว่างสอง datetimes
7. หมวดหมู่ : ใช้สำหรับรายการค่าข้อความ
การสร้าง DataFrame ในห้องสมุด Pandas
มีสองวิธีในการสร้าง data frame ใน วัตถุ pandas เราสามารถสร้างตารางหรือแทรกไฟล์ CSV ที่มีอยู่ได้ รหัสที่จะแทรกไฟล์ที่มีอยู่คือ:
df = pd.read_csv (“ file_name.csv ”)
ไวยากรณ์ในการสร้างตารางใหม่สำหรับ data frame คือ:
t = {'col 1': [1, 2], 'col 2': [3, 4]}
df = pd.DataFrame (ข้อมูล = t)
ต้องอ่าน: บทช่วยสอน Python Panda สำหรับผู้เริ่มต้น

การใช้ Pandas Dataframe.astype() Method
เมื่อเราแทรกตารางและดาต้าเฟรมลงใน อ็อบเจ็กต์ pandas แล้ว เราสามารถเริ่มแปลงประเภทข้อมูลของคอลัมน์ตั้งแต่หนึ่งคอลัมน์ขึ้นไปของตารางได้ เราสามารถตรวจสอบประเภทข้อมูลของค่าก่อนที่จะแปลงโดยใช้รหัส df.dtypes หรือ df.info( ) โค้ดทั้งสองนี้จะแสดงประเภทข้อมูลของแต่ละคอลัมน์ของตาราง
สิ่งที่ควรทราบอีกประการหนึ่งคือ DataFrame วิธี astype () สามารถทำให้เกิดข้อผิดพลาดได้หาก data frame มีค่า nan หรือ NA ก่อนดำเนินการต่อ เราต้องล้างค่าน่านทั้งหมดออกจากตาราง ไวยากรณ์ที่จะปล่อยค่า nan หรือ NA คือ:
df.dropna (แทนที่ = จริง)
การแปลงคอลัมน์ทั้งหมดของ Dataframe
ไวยากรณ์: df astype (' data_type ').dtypes
ชนิดข้อมูลของ dataframe ทั้งหมดจะถูกแปลงเป็นค่าที่เราใส่ลงใน ' data_type. '
การแปลงคอลัมน์เฉพาะของ Dataframe
ไวยากรณ์: df astype ({“ col_name ”: ' data_type '}).dtypes
“col_name” ที่นี่ต้องมีชื่อคอลัมน์เป็นอินพุต ไม่ว่าเราจะใส่ชื่อคอลัมน์ชนิดใด ประเภทข้อมูลของคอลัมน์นั้นจะเปลี่ยนเป็นค่าที่เราระบุใน ' data_type'
การแปลงหลายคอลัมน์พร้อมกัน
ไวยากรณ์: df astype ({“ col_name ”: 'data_type', “ col_name ”: ' data_type ', “ col_name ”: ' data_type '}).dtypes
ทั้งหมดที่เราทำที่นี่คือแยกคอลัมน์ทั้งหมดที่เราต้องการแปลงด้วยเครื่องหมายจุลภาค “ col_name ” และ ' data_type ' ในไวยากรณ์ต้องใช้ค่าเดียวกันกับที่จำเป็นขณะแปลงคอลัมน์เดียว
สรุปมัน
นี่คือวิธี ที่ Pandas DataFrame ใช้วิธี astype () ปัจจุบัน Python เป็นหนึ่งในภาษาการเขียนโปรแกรมที่เป็นที่ต้องการมากที่สุดเนื่องจากได้ก้าวเข้าสู่การเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูล หากคุณต้องการทราบว่า Python ถูกใช้อย่างไรในสองสาขานี้ และมันสามารถช่วย อาชีพของคุณใน Data Science ได้อย่างไร คุณสามารถอ่านทั้งหมดเกี่ยวกับมันในบล็อกของเรา คุณสามารถเยี่ยมชม เว็บไซต์ ของ Upgrad เพื่อรับ Executive PG Program ใน Data Science หรือ PG Certification ใน Machine Learning และ Deep
การเรียนแพนด้ายากแค่ไหน?
Pandas เป็นแพ็คเกจ Python ดังนั้น คุณจะต้องทำความคุ้นเคยกับพื้นฐานของไวยากรณ์ Python ก่อนจึงจะเริ่มใช้งานได้ ไวยากรณ์พื้นฐานของแพนด้าอาจดูแปลกในตอนแรก แต่ด้วยการฝึกฝน คุณสามารถเรียนรู้สิ่งต่าง ๆ เช่น การจัดกลุ่ม การใช้ฟังก์ชันกับแกนใดก็ได้ การหมุน ลักษณะอเนกประสงค์ของ Python ได้รับการขยายโดยการสร้างห้องสมุด Pandas เพื่อจัดการกับปัญหาการเรียนรู้ของเครื่องด้วย
ฉันจะติดตั้ง Pandas เวอร์ชันล่าสุดบนพีซีได้อย่างไร
ดาวน์โหลดและติดตั้ง pip . เวอร์ชันล่าสุด
2. ดาวน์โหลด Python เวอร์ชันล่าสุด เพื่อหลีกเลี่ยงปัญหาใดๆ กับการติดตั้ง Python ของคุณ ให้คลิกตัวเลือกเพื่อปิดใช้งานความยาวพาธ เมื่อคุณติดตั้ง Python เสร็จแล้ว
3. เมื่อติดตั้ง Python แล้ว คุณควรไปที่พรอมต์คำสั่งและติดตั้ง Pandas จากที่นั่น ไปที่ช่องค้นหาของเดสก์ท็อปแล้วพิมพ์ 'cmd' ลงไป โปรแกรมชื่อ Command Prompt ควรปรากฏขึ้น ในการเริ่มต้น เพียงคลิกปุ่ม
4. ตอนนี้ให้คำสั่ง 'pip install manager' ที่พรอมต์คำสั่ง รอให้การดาวน์โหลดเสร็จสิ้น จากนั้นคุณจะสามารถเรียกใช้ Pandas จากภายในแอปพลิเคชัน Python ของคุณ
ข้อจำกัดของการใช้ Pandas ใน Python คืออะไร?
ไวยากรณ์ของ Pandas บางตัวอาจซับซ้อนเมื่อใช้ระดับขั้นสูง นี่เป็นปัญหาเนื่องจากผู้ใช้จำนวนมากไม่สามารถย้ายระหว่างโค้ด Python มาตรฐานกับ Pandas ได้อย่างมีประสิทธิภาพและราบรื่น
2. ขณะที่คุณก้าวหน้าและเรียนรู้เพิ่มเติมเกี่ยวกับเฟรมเวิร์กของ Pandas คุณอาจพบว่าแนวคิดบางอย่างเข้าใจได้ยาก
3. Pandas จะมีประโยชน์น้อยมากเมื่อข้อมูลของคุณได้รับการอัปเกรดเป็นเมทริกซ์สามมิติ (3D) และคุณจะต้องพึ่งพาไลบรารีอื่นๆ เช่น NumPy เพื่อขอความช่วยเหลือ เนื่องจาก Pandas มีความเข้ากันได้ของเมทริกซ์ 3 มิติที่ไม่ดี