การเพิ่มคอลัมน์ใหม่ให้กับ Dataframe ที่มีอยู่ใน Pandas [2022]

เผยแพร่แล้ว: 2021-01-06

Python ซึ่งเป็นภาษาการเขียนโปรแกรมระดับสูงที่ตีความวัตถุประสงค์ทั่วไป เมื่อเร็ว ๆ นี้ได้กลายเป็นภาษาคอมพิวเตอร์ที่ยอดเยี่ยมเนื่องจากมีไลบรารีจำนวนมากและลักษณะที่ใช้งานง่าย ความนิยมของ Python เพิ่มขึ้นอย่างก้าวกระโดดด้วยการนำวิทยาศาสตร์ข้อมูลและการวิเคราะห์ข้อมูลไปใช้ มีไลบรารีนับพันที่สามารถรวมเข้ากับ Python เพื่อให้ทำงานในแนวดิ่งได้อย่างมีประสิทธิภาพ

Pandas เป็นหนึ่งในไลบรารีการวิเคราะห์ข้อมูลที่ออกแบบมาอย่างชัดเจนสำหรับ Python เพื่อดำเนินการจัดการข้อมูลและวิเคราะห์ข้อมูล ไลบรารี Pandas ประกอบด้วยโครงสร้างข้อมูลเฉพาะและการดำเนินการเพื่อจัดการกับตารางตัวเลข วิเคราะห์ข้อมูล และทำงานกับอนุกรมเวลา ในบทความนี้ คุณจะได้ทราบวิธีการ เพิ่มคอลัมน์ใน DataFrame ใน Pandas ที่มีอยู่แล้ว

อ่าน: Pandas Dataframe Astype

สารบัญ

DataFrame คืออะไร?

ก่อนที่จะรู้เกี่ยวกับวิธีการ เพิ่มคอลัมน์ใหม่ให้กับ DataFrame ที่มีอยู่ เรามาทำความรู้จักกับ DataFrames ใน Pandas กันก่อน DataFrame เป็นโครงสร้างข้อมูลที่เปลี่ยนแปลงได้ในรูปแบบของอาร์เรย์สองมิติที่สามารถเก็บค่าที่ต่างกันด้วยแกนที่มีป้ายกำกับ (แถวและคอลัมน์) DataFrame เป็นโครงสร้างข้อมูลซึ่งข้อมูลยังคงถูกจัดเก็บไว้ในการจัดเรียงแบบลอจิคัลของรูปแบบตาราง (แถวและคอลัมน์ที่ตัดกัน) องค์ประกอบหลักสามประการของ DataFrame คือ แถว คอลัมน์ และข้อมูล การสร้าง DataFrame ใน Python นั้นง่ายมาก

นำเข้าแพนด้าเป็น pd

l = ['This', 'is', 'a', 'List', 'preparing', 'for', 'DataFrame']

datfr = pd.DataFrame(l)

พิมพ์ (datfr)

โปรแกรมข้างต้นจะสร้าง DataFrame จำนวน 7 แถวและ 1 คอลัมน์

dataframe ที่มีอยู่ใน Pandas

วิธีเพิ่มคอลัมน์ใน DataFrames ที่มีอยู่

มีหลายวิธีใน การเพิ่มคอลัมน์ใหม่ให้กับ DataFrame ใน Pandas เราได้รวบรวมแนวคิดในการสร้าง DataFrame พื้นฐานโดยใช้ไลบรารี Pandas แล้ว ให้เราเตรียมห้องสมุดที่มีอยู่แล้วและดำเนินการกับมัน

นำเข้าแพนด้าเป็น pd

# กำหนดพจนานุกรมที่มีข้อมูลของผู้เชี่ยวชาญ

datfr = {'Name': ['Karl', 'Gaurav', 'Ray', 'Mimo'],

'ความสูง': [6.2, 5.7, 6.1, 5.9],

'การกำหนด': ['นักวิทยาศาสตร์', 'ศาสตราจารย์', 'นักวิเคราะห์ข้อมูล', 'นักวิเคราะห์ความปลอดภัย']}

df = pd.DataFrame (datfr)

พิมพ์ (df)

เอาท์พุท:

อ่าน: บทช่วยสอน Python Pandas

เทคนิค 1: แทรก () วิธีการ

ตอนนี้ ในการเพิ่มคอลัมน์ใหม่ให้กับ DataFrame ที่มีอยู่ เราต้องใช้เมธอด insert() ก่อนที่จะใช้เมธอด insert() โปรดแจ้งให้เราทราบถึงการทำงาน DataFrame.insert() อนุญาตให้เพิ่มคอลัมน์ในตำแหน่งใดก็ได้ที่นักวิเคราะห์ข้อมูลต้องการ นอกจากนี้ยังรองรับความเป็นไปได้หลายประการสำหรับการฉีดค่าคอลัมน์ โปรแกรมเมอร์สามารถระบุดัชนีเพื่อฉีดคอลัมน์ข้อมูลในตำแหน่งนั้นๆ

นำเข้าแพนด้าเป็น pd

# กำหนดพจนานุกรมที่มีข้อมูลของผู้เชี่ยวชาญ

datfr = {'Name': ['Karl', 'Gaurav', 'Ray', 'Mimo'],

'ความสูง': [6.2, 5.7, 6.1, 5.9],

'การกำหนด': ['นักวิทยาศาสตร์', 'ศาสตราจารย์', 'นักวิเคราะห์ข้อมูล', 'นักวิเคราะห์ความปลอดภัย']}

df = pd.DataFrame (datfr)

df.insert(3, “อายุ”, [40, 33, 27, 26], ทรู)

พิมพ์ (df)

มันจะเพิ่มคอลัมน์ 'อายุ' ในตำแหน่งดัชนีที่สามตามที่กำหนดไว้ในเมธอด insert() เป็นพารามิเตอร์แรก

เทคนิค 2: กำหนด () วิธีการ

อีกวิธีหนึ่งในการเพิ่มคอลัมน์ใน DataFrame คือการใช้เมธอด assign() ของไลบรารี Pandas วิธีนี้ใช้วิธีการอื่นในการเพิ่มคอลัมน์ใหม่ให้กับ DataFrame ที่มีอยู่ Dataframe.assign() จะสร้าง DataFrame ใหม่พร้อมกับคอลัมน์ จากนั้นจะผนวกเข้ากับ DataFrame ที่มีอยู่

นำเข้าแพนด้าเป็น pd

datfr = {'Name': ['Karl', 'Gaurav', 'Ray', 'Mimo'],

'ความสูง': [6.2, 5.7, 6.1, 5.9],

'การกำหนด': ['นักวิทยาศาสตร์', 'ศาสตราจารย์', 'นักวิเคราะห์ข้อมูล', 'นักวิเคราะห์ความปลอดภัย']}

dfI = pd.DataFrame (datfr)

dfII = dfI.assign (ตำแหน่ง = ['Noida', 'Amsterdam', 'Cambridge', 'Bangaluru'])

พิมพ์ (dfII)

เอาท์พุท:

เทคนิค 3: การสร้างรายการใหม่เป็นคอลัมน์

วิธีสุดท้ายที่โปรแกรมเมอร์สามารถใช้เพื่อ เพิ่มคอลัมน์ใน DataFrame คือการสร้างรายการใหม่เป็นคอลัมน์แยกของข้อมูลและผนวกคอลัมน์เข้ากับ DataFrame ที่มีอยู่

นำเข้าแพนด้าเป็น pd

datfr = {'Name': ['Karl', 'Gaurav', 'Ray', 'Mimo'],

'ความสูง': [6.2, 5.7, 6.1, 5.9],

'การกำหนด': ['นักวิทยาศาสตร์', 'ศาสตราจารย์', 'นักวิเคราะห์ข้อมูล', 'นักวิเคราะห์ความปลอดภัย']}

df = pd.DataFrame (datfr)

loc = ['Noida', 'Amsterdam', 'Cambridge', 'บังกาลอร์']

df['Location'] = loc

พิมพ์ (df)

เอาท์พุท:

ชำระเงิน: คำถามสัมภาษณ์แพนด้า

บทสรุป

นักวิเคราะห์ข้อมูลดำเนินการหลักในการเพิ่มชุดข้อมูลพิเศษในรูปแบบคอลัมน์ มีวิธีต่างๆ ที่นักวิเคราะห์ข้อมูลหรือโปรแกรมเมอร์สามารถใช้เพื่อ เพิ่มคอลัมน์ใหม่ให้กับ DataFrame ที่มีอยู่ ใน Pandas วิธีการเหล่านี้จะทำให้โปรแกรมเมอร์สะดวกที่จะเพิ่มคอลัมน์ข้อมูลได้ตลอดเวลาในขณะที่วิเคราะห์ข้อมูล Pandas

หากคุณอยากเรียนรู้เกี่ยวกับ DataFrame ใน Pandas ให้ลองดูที่ IIIT-B & upGrad's Executive PG Program in Data Science ซึ่งสร้างขึ้นสำหรับมืออาชีพที่ทำงานและเสนอกรณีศึกษาและโครงการมากกว่า 10 รายการ เวิร์กช็อปภาคปฏิบัติ การให้คำปรึกษากับผู้เชี่ยวชาญในอุตสาหกรรม ตัวต่อตัวกับที่ปรึกษาในอุตสาหกรรม การเรียนรู้มากกว่า 400 ชั่วโมงและความช่วยเหลือด้านงานกับบริษัทชั้นนำ

ทำไม Pandas เป็นหนึ่งในไลบรารี่ที่ต้องการมากที่สุดในการสร้าง data frames ใน Python?

ห้องสมุด Pandas ถือว่าเหมาะสมที่สุดสำหรับการสร้าง data frames เนื่องจากมีฟีเจอร์ต่าง ๆ ที่ทำให้สร้าง data frame ได้อย่างมีประสิทธิภาพ คุณลักษณะเหล่านี้บางส่วนมีดังนี้ - Pandas ให้กรอบข้อมูลต่างๆ แก่เรา ซึ่งไม่เพียงแต่ช่วยให้สามารถแสดงข้อมูลได้อย่างมีประสิทธิภาพเท่านั้น แต่ยังช่วยให้เราจัดการได้ มีคุณสมบัติการจัดตำแหน่งและการทำดัชนีที่มีประสิทธิภาพซึ่งให้วิธีการติดฉลากและจัดระเบียบข้อมูลอย่างชาญฉลาด คุณลักษณะบางอย่างของ Pandas ทำให้โค้ดสะอาดและเพิ่มความสามารถในการอ่าน ซึ่งทำให้มีประสิทธิภาพมากขึ้น นอกจากนี้ยังสามารถอ่านไฟล์ได้หลายรูปแบบ JSON, CSV, HDF5 และ Excel เป็นรูปแบบไฟล์บางรูปแบบที่ Pandas รองรับ การรวมชุดข้อมูลหลายชุดเข้าด้วยกันเป็นความท้าทายอย่างแท้จริงสำหรับโปรแกรมเมอร์หลายคน แพนด้าก็เอาชนะสิ่งนี้เช่นกันและรวมชุดข้อมูลหลายชุดเข้าด้วยกันอย่างมีประสิทธิภาพ Pandas ยังให้การเข้าถึงไลบรารี Python ที่สำคัญอื่นๆ เช่น Matplotlib และ NumPy ซึ่งทำให้เป็นไลบรารีที่มีประสิทธิภาพสูง

ไลบรารี Python อื่น ๆ ที่ห้องสมุด Pandas ทำงานด้วยคืออะไร

Pandas ไม่เพียงแต่ทำงานเป็นห้องสมุดกลางสำหรับการสร้างกรอบข้อมูลเท่านั้น แต่ยังทำงานร่วมกับไลบรารี่และเครื่องมืออื่นๆ ของ Python เพื่อให้มีประสิทธิภาพมากขึ้น Pandas สร้างขึ้นบนแพ็คเกจ NumPy Python ซึ่งบ่งชี้ว่าโครงสร้างไลบรารี Pandas ส่วนใหญ่นั้นจำลองจากแพ็คเกจ NumPy การวิเคราะห์ทางสถิติเกี่ยวกับข้อมูลในไลบรารี Pandas ดำเนินการโดย SciPy การพล็อตฟังก์ชันบน Matplotlib และอัลกอริธึมการเรียนรู้ของเครื่องใน Scikit-learn Jupyter Notebook เป็นสภาพแวดล้อมแบบโต้ตอบบนเว็บที่ทำงานเป็น IDE และมีสภาพแวดล้อมที่ดีสำหรับ Pandas

นอกจากการแทรกแล้ว การดำเนินการพื้นฐานของ Dataframe คืออะไร

การเลือกดัชนีหรือคอลัมน์ก่อนเริ่มดำเนินการใดๆ เช่น การเพิ่มหรือการลบเป็นสิ่งสำคัญ เมื่อคุณเรียนรู้วิธีเข้าถึงค่าและเลือกคอลัมน์จาก Data Frame แล้ว คุณสามารถเรียนรู้วิธีเพิ่มดัชนี แถว หรือคอลัมน์ใน Pandas Dataframe หากดัชนีใน data frame ไม่ออกมาตามที่คุณต้องการ คุณสามารถรีเซ็ตได้ สำหรับการรีเซ็ตดัชนี คุณสามารถใช้ฟังก์ชัน “reset_index()”