Pandas Dataframe Astype: Sintaks, Tipe Data, Membuat Dataframe

Diterbitkan: 2020-08-28

Python adalah salah satu bahasa yang paling banyak digunakan di berbagai industri untuk keperluan manipulasi dan analisis data. Alasan terbesar di balik popularitas Python adalah kumpulan perpustakaannya yang luas yang memudahkan pengembang untuk memelihara dan memantau data. Salah satu perpustakaan yang ditulis untuk Python adalah Pandas . Pustaka Pandas , khususnya, digunakan untuk memanipulasi deret waktu dan tabel. Lihat kursus ilmu data kami untuk mempelajari lebih lanjut tentang panda.

Bingkai Data Panda . astype () atau kadang-kadang juga disebut sebagai astype () metode digunakan untuk melemparkan objek panda ke dtype. fungsi astype (). Ini sangat berguna ketika kita perlu mengonversi tipe data dari satu atau beberapa kolom tabel ke kolom lainnya.

Daftar isi

Sintaks Pandas DataFrame.astype()

Pertama, sebelum membahas sintaks, kita perlu mengimpor perpustakaan Pandas, yang dilakukan dengan:

impor panda sebagai pd

Sintaks untuk DataFrame. metode astype () adalah:

DataFrame.astype(dtype, copy=True, error='naikkan', **kwargs)

Parameter

Keterangan

Nilai default

tipe d

Menggunakan numpy.dtype atau tipe Python untuk mentransmisikan seluruh objek ke tipe yang sama. Alternatifnya juga dapat menggunakan {col: dtype, ?} di mana col adalah label kolom, dan dtype akan berfungsi sama untuk mentransmisikan satu atau lebih kolom DataFrame ke tipe khusus kolom.

tipe d

salinan

Mengembalikan salinan saat menyetel ke True (mengatur copy=false dapat menyebarkan perubahan nilai ke objek panda lainnya).

benar

kesalahan

Mengontrol peningkatan pengecualian pada data yang tidak valid untuk tipe-d yang diberikan.

menaikkan

kwargs

Argumen kata kunci untuk diteruskan ke konstruktor.

Pengembalian : dicor: kembali mirip dengan jenis pemanggil.

Baca: Bingkai Data dengan Python

Tipe Data di perpustakaan Pandas

Sekarang sejak Pandas DataFrame. metode astype () adalah tentang casting dan mengubah tipe data dalam tabel, mari kita lihat tipe data dan penggunaannya di perpustakaan Pandas .

1. Objek : Digunakan untuk nilai teks atau alfanumerik.

2. Int64 : Digunakan untuk bilangan Integer.

3. Float64 : Digunakan untuk bilangan floating-point.

4. Bool : Digunakan untuk nilai True/False.

5. Datetime64 : Digunakan untuk nilai tanggal dan waktu.

6. Timedelta[ns] : Digunakan untuk perbedaan antara dua waktu.

7. Kategori : Digunakan untuk daftar nilai teks.

Membuat DataFrame di perpustakaan Pandas

Ada dua cara untuk membuat bingkai data di objek pandas . Kita dapat membuat tabel atau menyisipkan file CSV yang ada. Kode untuk menyisipkan file yang ada adalah:

df = pd.read_csv(“ nama_file.csv ”)

Sintaks untuk membuat tabel baru untuk bingkai data adalah:

t = {'kol 1': [1, 2], 'kol 2': [3, 4]}

df = pd.DataFrame(data=t)

Wajib Dibaca: Tutorial Python Panda Untuk Pemula

Menggunakan Metode Pandas Dataframe.astype()

Setelah tabel dan kerangka data dimasukkan ke dalam objek pandas , kita dapat mulai mengonversi tipe data dari satu atau beberapa kolom tabel. Kita dapat memeriksa tipe data nilai sebelum mengonversinya dengan menggunakan kode df.dtypes atau df.info() . Kedua kode ini akan menampilkan tipe data dari setiap kolom tabel.

Hal lain yang perlu diperhatikan adalah bahwa DataFrame. metode astype () dapat memberikan error jika data frame memiliki nilai nan atau NA. Jadi sebelum melanjutkan, kita perlu menghapus semua nilai nan dari tabel. Sintaks untuk menjatuhkan nilai nan atau NA adalah:

df.dropna(di tempat = Benar)

Mengonversi Semua Kolom dari Dataframe

Sintaks: df. astype (' tipe_data ') .dtypes

Seluruh tipe data kerangka data akan dikonversi ke nilai yang kita masukkan ke dalam ' data_type. '

Mengonversi Kolom Spesifik dari Dataframe

Sintaks: df. astype ({“ col_name ”: ' data_type '}).dtypes

“col_name” di sini membutuhkan nama kolom sebagai input. Apapun nama kolom yang kita masukkan, tipe data kolom itu akan diubah menjadi nilai yang kita berikan di ' data_type.'

Mengonversi Beberapa Kolom Sekaligus

Sintaks: df. astype ({“ col_name ”: 'data_type', “ col_name ”: ' data_type ', “ col_name ”: ' data_type '}).dtypes

Yang kami lakukan di sini adalah memisahkan semua kolom yang ingin kami konversi dengan koma. col_name ” dan ' data_type ' dalam sintaks memerlukan nilai yang sama seperti yang diperlukan saat mengonversi satu kolom.

Meringkasnya

Ini adalah bagaimana DataFrame Pandas . metode astype () digunakan. Python saat ini adalah salah satu bahasa pemrograman yang paling disukai karena juga telah menempatkan kaki ke dalam Pembelajaran Mesin dan Ilmu Data. Jika Anda ingin tahu bagaimana Python digunakan di kedua bidang ini, dan bagaimana Python dapat membantu karir Anda di Ilmu Data , Anda dapat membaca semuanya di blog kami. Anda dapat mengunjungi situs web Upgrade untuk mendapatkan Program PG Eksekutif dalam Ilmu Data atau sertifikasi PG dalam Pembelajaran Mesin dan Deep

Seberapa sulitkah mempelajari Panda?

Pandas adalah paket Python, oleh karena itu Anda harus terbiasa dengan dasar-dasar sintaks Python sebelum Anda mulai menggunakannya. Sintaks pandas dasar mungkin tampak aneh pada awalnya, tetapi dengan latihan, Anda dapat mempelajari hal-hal seperti mengelompokkan, menerapkan fungsi ke sumbu apa pun, memutar. Sifat multiguna Python telah diperluas dengan pembuatan perpustakaan Pandas untuk mengatasi masalah pembelajaran mesin juga.

Bagaimana cara menginstal versi terbaru Pandas di PC?

Unduh dan instal pip versi terbaru

2. Unduh versi terbaru Python. Untuk menghindari kesulitan dengan instalasi Python Anda, klik opsi untuk menonaktifkan panjang jalur setelah Anda selesai menginstal Python.

3. Sekarang setelah Python terinstal, Anda harus pergi ke command prompt dan menginstal Pandas dari sana. Jadi, buka kotak pencarian desktop Anda dan ketik 'cmd' ke dalamnya. Sebuah program bernama Command Prompt akan muncul. Untuk memulai, cukup klik tombol.

4. Sekarang, berikan perintah 'pip install manager' pada command prompt. Tunggu hingga unduhan selesai, lalu Anda dapat menjalankan Pandas dari dalam aplikasi Python Anda.

Apa batasan menggunakan Pandas dengan Python?

Beberapa sintaks Panda bisa menjadi rumit saat menggunakan level lanjutannya. Ini adalah masalah karena banyak pengguna tidak dapat berpindah antara kode Python standar dan Panda dengan cara yang efisien dan lancar.

2. Saat Anda maju dan mempelajari lebih lanjut tentang kerangka Pandas, Anda mungkin menemukan beberapa konsep yang agak sulit untuk dipahami.

3. Panda tidak akan banyak berguna setelah data Anda ditingkatkan ke matriks tiga dimensi (3D), dan Anda harus bergantung pada pustaka lain seperti NumPy untuk bantuan, karena Panda memiliki kompatibilitas matriks 3D yang buruk.