Menambahkan Kolom Baru Ke Dataframe Yang Ada Di Pandas [2022]

Diterbitkan: 2021-01-06

Python, bahasa pemrograman tingkat tinggi yang ditafsirkan, tujuan umum, baru-baru ini menjadi bahasa komputasi yang fenomenal karena koleksi perpustakaannya yang luas dan sifatnya yang mudah diimplementasikan. Popularitas Python mengambil lompatan besar dengan penerapan ilmu data dan analisis data. Ada ribuan perpustakaan yang dapat diintegrasikan dengan Python untuk membuatnya bekerja pada vertikal apa pun secara efisien.

Pandas adalah salah satu perpustakaan analitik data yang dirancang secara eksplisit untuk Python untuk melakukan manipulasi data dan analisis data. Pustaka Pandas terdiri dari struktur dan operasi data khusus untuk menangani tabel numerik, menganalisis data, dan bekerja dengan deret waktu. Pada artikel ini, Anda akan mengetahui cara menambahkan kolom ke DataFrame di Pandas yang sudah ada.

Baca: Pandas Dataframe Astype

Daftar isi

Apa itu DataFrame?

Sebelum mengetahui tentang cara menambahkan kolom baru ke DataFrame yang ada , mari kita lihat dulu DataFrames di Pandas . DataFrame adalah struktur data yang dapat berubah dalam bentuk array dua dimensi yang dapat menyimpan nilai heterogen dengan sumbu berlabel (baris dan kolom). DataFrame adalah struktur data di mana data tetap disimpan dalam pengaturan logis dari mode tabular (berpotongan baris dan kolom). Tiga komponen utama dari DataFrame adalah baris, kolom, dan data. Membuat DataFrame dengan Python sangat mudah.

impor panda sebagai pd

l = ['Ini', 'adalah', 'a', 'Daftar', 'mempersiapkan', 'untuk', 'DataFrame']

datfr = pd.DataFrame(l)

cetak (datfr)

Program di atas akan membuat DataFrame dari 7 baris dan satu kolom.

kerangka data yang ada di Pandas

Bagaimana Menambahkan Kolom ke DataFrame yang Ada?

Ada berbagai cara untuk menambahkan kolom baru ke DataFrame di Pandas . Kami telah mengumpulkan ide tentang cara membuat DataFrame dasar menggunakan perpustakaan Pandas . Sekarang mari kita siapkan perpustakaan yang sudah ada dan kerjakan.

impor panda sebagai pd

# Tentukan kamus yang berisi data Profesional

datfr = {'Nama': ['Karl', 'Gaurav', 'Ray', 'Mimo'],

'Tinggi': [6.2, 5.7, 6.1, 5.9],

'Penunjukan': ['Ilmuwan', 'Profesor', 'Analis Data', 'Analis Keamanan']}

df = pd.DataFrame(datfr)

cetak (df)

Keluaran:

Baca: Tutorial Panda Python

Teknik 1: metode insert()

Sekarang, untuk menambahkan kolom baru ke DataFrame yang ada, kita harus menggunakan metode insert(). Sebelum menerapkan metode insert(), beri tahu kami tentang cara kerjanya. DataFrame.insert() memungkinkan penambahan kolom pada posisi apa pun yang diinginkan oleh analis data. Ini juga mengakomodasi beberapa kemungkinan untuk memasukkan nilai kolom. Pemrogram dapat menentukan indeks untuk menyuntikkan kolom data pada posisi tertentu.

impor panda sebagai pd

# Tentukan kamus yang berisi data Profesional

datfr = {'Nama': ['Karl', 'Gaurav', 'Ray', 'Mimo'],

'Tinggi': [6.2, 5.7, 6.1, 5.9],

'Penunjukan': ['Ilmuwan', 'Profesor', 'Analis Data', 'Analis Keamanan']}

df = pd.DataFrame(datfr)

df.insert(3, “Usia”, [40, 33, 27, 26], Benar)

cetak (df)

Ini akan menambahkan kolom 'Usia' di posisi indeks ketiga seperti yang didefinisikan dalam metode insert() sebagai parameter pertama.

Teknik 2: assign() Metode

Metode lain untuk menambahkan kolom ke DataFrame adalah menggunakan metode assign() dari perpustakaan Pandas. Metode ini menggunakan pendekatan yang berbeda untuk menambahkan kolom baru ke DataFrame yang ada. Dataframe.assign() akan membuat DataFrame baru bersama dengan kolom. Kemudian itu akan menambahkannya ke DataFrame yang ada.

impor panda sebagai pd

datfr = {'Nama': ['Karl', 'Gaurav', 'Ray', 'Mimo'],

'Tinggi': [6.2, 5.7, 6.1, 5.9],

'Penunjukan': ['Ilmuwan', 'Profesor', 'Analis Data', 'Analis Keamanan']}

dfI = pd.DataFrame(datfr)

dfII = dfI.assign(Location = ['Noida', 'Amsterdam', 'Cambridge', 'Bangaluru'])

cetak(dfII)

KELUARAN:

Teknik 3: Membuat Daftar Baru sebagai Kolom

Metode terakhir yang dapat digunakan programmer untuk menambahkan kolom ke DataFrame adalah dengan membuat daftar baru sebagai kolom data terpisah dan menambahkan kolom ke DataFrame yang ada.

impor panda sebagai pd

datfr = {'Nama': ['Karl', 'Gaurav', 'Ray', 'Mimo'],

'Tinggi': [6.2, 5.7, 6.1, 5.9],

'Penunjukan': ['Ilmuwan', 'Profesor', 'Analis Data', 'Analis Keamanan']}

df = pd.DataFrame(datfr)

loc = ['Noida', 'Amsterdam', 'Cambridge', 'Bangaluru']

df['Lokasi'] = lokasi

cetak (df)

KELUARAN:

Checkout: Pertanyaan Wawancara Pandas

Kesimpulan

Analis data melakukan operasi utama untuk menambahkan kumpulan data tambahan dalam bentuk kolom. Ada pendekatan berbeda yang dapat digunakan oleh analis data atau programmer untuk menambahkan kolom baru ke DataFrame yang ada di Pandas. Metode ini akan memudahkan pemrogram untuk menambahkan kolom data kapan saja saat menganalisis data Pandas.

Jika Anda ingin tahu tentang DataFrame di Pandas, lihat Program PG Eksekutif IIIT-B & upGrad dalam Ilmu Data yang dibuat untuk para profesional yang bekerja dan menawarkan 10+ studi kasus & proyek, lokakarya praktis, bimbingan dengan pakar industri, 1-on-1 dengan mentor industri, 400+ jam pembelajaran dan bantuan pekerjaan dengan perusahaan-perusahaan top.

Mengapa Pandas salah satu perpustakaan yang paling disukai untuk membuat bingkai data dengan Python?

Pustaka Panda dianggap paling cocok untuk membuat bingkai data karena menyediakan berbagai fitur yang membuatnya efisien untuk membuat bingkai data. Beberapa dari fitur ini adalah sebagai berikut - Panda memberi kita berbagai bingkai data yang tidak hanya memungkinkan representasi data yang efisien tetapi juga memungkinkan kita untuk memanipulasinya. Ini menyediakan fitur penyelarasan dan pengindeksan yang efisien yang menyediakan cara cerdas untuk memberi label dan mengatur data. Beberapa fitur Pandas membuat kode bersih dan meningkatkan keterbacaannya, sehingga membuatnya lebih efisien. Itu juga dapat membaca berbagai format file. JSON, CSV, HDF5, dan Excel adalah beberapa format file yang didukung oleh Pandas. Penggabungan beberapa kumpulan data telah menjadi tantangan nyata bagi banyak programmer. Panda juga mengatasi ini dan menggabungkan beberapa kumpulan data dengan sangat efisien. Pandas juga menyediakan akses ke pustaka Python penting lainnya seperti Matplotlib dan NumPy yang menjadikannya pustaka yang sangat efisien.

Apa perpustakaan Python lain yang bekerja dengan perpustakaan Pandas?

Pandas tidak hanya berfungsi sebagai pustaka pusat untuk membuat bingkai data, tetapi juga berfungsi dengan pustaka dan alat Python lainnya agar lebih efisien. Pandas dibangun di atas paket NumPy Python yang menunjukkan bahwa sebagian besar struktur perpustakaan Pandas direplikasi dari paket NumPy. Analisis statistik pada data di perpustakaan Pandas dioperasikan oleh SciPy, memplot fungsi di Matplotlib, dan algoritma pembelajaran mesin di Scikit-learn. Jupyter Notebook adalah lingkungan interaktif berbasis web yang berfungsi sebagai IDE dan menawarkan lingkungan yang baik untuk Panda.

Seiring dengan penyisipan, apa operasi dasar dari Dataframe?

Memilih indeks atau kolom sebelum memulai operasi apa pun seperti penambahan atau penghapusan adalah penting. Setelah Anda mempelajari cara mengakses nilai dan memilih kolom dari Bingkai Data, Anda dapat belajar menambahkan indeks, baris, atau kolom dalam Bingkai Data Pandas. Jika indeks pada data frame tidak sesuai dengan yang diinginkan, Anda dapat meresetnya. Untuk mengatur ulang indeks, Anda dapat menggunakan fungsi "reset_index()".