17 Pertanyaan & Jawaban Wawancara Pandas Yang Harus Dibaca [Untuk Freshers & Berpengalaman]
Diterbitkan: 2020-07-29Pandas adalah pustaka Python sumber terbuka dan berlisensi BSD yang menawarkan struktur data berkinerja tinggi, mudah digunakan, dan alat analisis data. Python dengan Pandas digunakan dalam beragam disiplin ilmu, termasuk ekonomi, keuangan, statistik, analitik, dan banyak lagi. Dalam artikel ini, kami telah mencantumkan beberapa pertanyaan wawancara panda penting dan pertanyaan wawancara NumPy yang harus diketahui oleh pelajar python. Jika Anda ingin mempelajari lebih lanjut tentang python, lihat program ilmu data kami.
Daftar isi
Pertanyaan & Jawaban Wawancara Panda
Pertanyaan 1 – Definisikan Python Pandas.
Panda merujuk ke pustaka perangkat lunak yang ditulis secara eksplisit untuk Python, yang digunakan untuk menganalisis dan memanipulasi data. Pandas adalah pustaka lintas platform sumber terbuka yang dibuat oleh Wes McKinney. Ini dirilis pada tahun 2008 dan menyediakan struktur data dan operasi untuk memanipulasi data numerik dan deret waktu. Panda dapat diinstal menggunakan distribusi pip atau Anaconda. Panda membuatnya sangat mudah untuk melakukan operasi pembelajaran mesin pada data tabular.
Pertanyaan 2 – Apa Jenis Struktur Data yang Berbeda di Pandas?
Pustaka Panda mendukung dua jenis utama struktur data, DataFrames dan Seri. Kedua struktur data ini dibangun di atas NumPy. Seri adalah struktur data satu dimensi dan paling sederhana, sedangkan DataFrame adalah dua dimensi. Label sumbu lain yang dikenal sebagai "Panel" adalah struktur data 3 dimensi dan mencakup item seperti sumbu_utama dan sumbu_minor.
Sumber
Pertanyaan 3 – Jelaskan Seri Dalam Pandas.
Seri adalah larik satu dimensi yang dapat menampung nilai data jenis apa pun (string, float, integer, objek python, dll.). Ini adalah jenis struktur data paling sederhana di Pandas; di sini, label sumbu data disebut indeks.
Pertanyaan 4 – Mendefinisikan Dataframe Dalam Pandas.
DataFrame adalah array 2 dimensi di mana data disejajarkan dalam bentuk tabel dengan baris dan kolom. Dengan struktur ini, Anda dapat melakukan operasi aritmatika pada baris dan kolom.
Pertanyaan 5 – Bagaimana Cara Membuat Dataframe Kosong Di Pandas?
Untuk membuat DataFrame kosong di Pandas, ketik
impor panda sebagai pd
ab = pd.DataFrame()
Pertanyaan 6 – Apa Fitur Paling Penting dari Pandas Library?
Fitur penting dari perpustakaan panda adalah:
- Penyelarasan Data
- Gabung dan gabung
- Memori Efisien
- Seri waktu
- Membentuk kembali
Baca: Dataframe di Apache PySpark: Tutorial Komprehensif
Pertanyaan 7 – Bagaimana Anda Menjelaskan Pengindeksan Ulang Di Pandas?
Mengindeks ulang berarti memodifikasi data agar sesuai dengan sekumpulan label tertentu di sepanjang sumbu tertentu.
Berbagai operasi dapat dicapai dengan menggunakan pengindeksan, seperti-
- Sisipkan penanda nilai yang hilang (NA) di lokasi label di mana tidak ada data untuk label tersebut.
- Susun ulang kumpulan data yang ada agar sesuai dengan kumpulan label baru.
Pertanyaan 8 – Apa saja cara berbeda untuk membuat DataFrame di panda? Jelaskan dengan contoh.
DataFrame dapat dibuat menggunakan Lists atau Dict of nd arrays.
Contoh 1 – Membuat DataFrame menggunakan Daftar
impor panda sebagai pd
# daftar string
Strlist = ['Panda', 'NumPy']
# Memanggil konstruktor DataFrame pada daftar
daftar = pd.DataFrame(Strlist)
cetak (daftar)
Contoh 2 – Membuat DataFrame menggunakan dict array
impor panda sebagai pd
daftar = {'ID': [1001, 1002, 1003],'Departemen':['Ilmu', 'Perdagangan', 'Seni',]}
daftar = pd.DataFrame(daftar)
cetak (daftar)
Lihat: Pertanyaan Wawancara Ilmu Data
Pertanyaan 9 – Jelaskan Data Kategoris Pada Pandas ?
Data kategoris mengacu pada data waktu nyata yang dapat berulang; misalnya, nilai data di bawah kategori seperti negara, jenis kelamin, kode akan selalu berulang. Nilai kategoris dalam panda juga hanya dapat mengambil sejumlah nilai yang mungkin terbatas dan tetap.
Operasi numerik tidak dapat dilakukan pada data tersebut. Semua nilai data kategorikal dalam pandas baik dalam kategori atau np.nan.
Tipe data ini dapat berguna dalam kasus berikut:
Jika variabel string hanya berisi beberapa nilai yang berbeda, mengubahnya menjadi variabel kategori dapat menghemat beberapa memori.
Ini berguna sebagai sinyal ke pustaka Python lainnya karena kolom ini harus diperlakukan sebagai variabel kategoris.
Urutan leksikal dapat dikonversi ke urutan kategoris untuk diurutkan dengan benar, seperti urutan logis.
Pertanyaan 10 – Buat Seri Menggunakan Dict In Pandas.

impor panda sebagai pd
impor numpy sebagai np
ser = {'a' : 1, 'b' : 2, 'c' : 3}
ans = pd.Seri(ser)
cetak (jawaban)
Pertanyaan 11 – Bagaimana Cara Membuat Salinan Seri Di Pandas?
Untuk membuat salinan seri di panda, sintaks berikut digunakan:
pandas.Series.copy
Seri.copy(dalam=Benar)
* jika nilai kedalaman disetel ke salah, itu tidak akan menyalin data maupun indeks.
Pertanyaan 12 – Bagaimana Anda Akan Menambahkan Indeks, Baris, Atau Kolom Ke Kerangka Data Di Pandas?
Untuk menambahkan baris ke DataFrame, kita dapat menggunakan .loc(), .iloc() dan .ix(). .loc() berbasis label, .iloc() berbasis integer dan .ix() adalah label booth dan berbasis integer. Untuk menambahkan kolom ke DataFrame, kita dapat kembali menggunakan .loc() atau .iloc().
Pertanyaan 13 – Metode Apa yang Akan Anda Gunakan Untuk Mengganti Nama Indeks Atau Kolom Dataframe Pandas?
Metode .rename dapat digunakan untuk mengganti nama kolom atau nilai indeks DataFrame
Pertanyaan 14 – Bagaimana Anda Bisa Iterate Over Dataframe Di Pandas?
Untuk mengulangi DataFrame di pandas for loop dapat digunakan dalam kombinasi dengan panggilan iterrows ().
Pertanyaan 15 – Apa itu Pandas Numpy Array?
Numerical Python (NumPy) didefinisikan sebagai paket inbuilt dalam python untuk melakukan perhitungan numerik dan pemrosesan elemen array multidimensi dan satu dimensi.
Array NumPy menghitung lebih cepat dibandingkan dengan array Python lainnya.
Pertanyaan 16 – Bagaimana Sebuah Dataframe Dapat Dikonversi Menjadi File Excel?
Untuk mengonversi satu objek ke file excel, kita cukup menentukan nama file target. Namun, untuk mengonversi beberapa lembar, kita perlu membuat objek ExcelWriter bersama dengan nama file target dan menentukan lembar yang ingin kita ekspor.
Pertanyaan 17 – Apa Fungsi Groupby Di Pandas?
Di Pandas, fungsi groupby () memungkinkan pemrogram untuk mengatur ulang data dengan menggunakannya di set dunia nyata. Tugas utama dari fungsi ini adalah untuk membagi data menjadi berbagai kelompok.
Baca Juga: 15 Proyek Sumber Terbuka Python AI & Pembelajaran Mesin Terbaik
Kesimpulan
Kami berharap pertanyaan wawancara P andas yang disebutkan di atas dan pertanyaan wawancara NumPy akan membantu Anda mempersiapkan sesi wawancara mendatang. Jika Anda mencari kursus yang dapat membantu Anda menguasai bahasa Python , upGrad bisa menjadi platform terbaik.
Jika Anda penasaran untuk belajar tentang ilmu data, lihat Program PG Eksekutif IIIT-B & upGrad dalam Ilmu Data yang dibuat untuk para profesional yang bekerja dan menawarkan 10+ studi kasus & proyek, lokakarya praktis, bimbingan dengan pakar industri, 1 -on-1 dengan mentor industri, 400+ jam pembelajaran dan bantuan pekerjaan dengan perusahaan-perusahaan top.
Pustaka Panda digunakan untuk tujuan apa?
Alasan utama di balik penggunaan Pandas adalah untuk analisis data. Pandas memungkinkan pengguna untuk mengimpor data dari berbagai format seperti Microsoft Excel, SQL, JSON, dan juga nilai yang dipisahkan koma. Panda dianggap sangat berguna untuk analisis data karena memungkinkan pengguna untuk melakukan operasi manipulasi data yang berbeda seperti memilih, membentuk kembali, menggabungkan, dan juga membersihkan data. Selain itu, Pandas juga menyediakan berbagai fitur data wrangling.
Secara sederhana, kita dapat mengatakan bahwa Panda memudahkan untuk melakukan berbagai tugas yang memakan waktu dan berulang yang melibatkan data. Tugas yang dipermudah dengan Panda adalah:
1. Menggabungkan dan bergabung dengan Statistik
2.analisis Data
3. Data normalisasi
4. mengisi Data
5. membersihkan Data
6. inspeksi Memuat dan menyimpan data
7. Visualisasi data
Ini hanya beberapa tugas manipulasi data yang dipermudah dengan Pandas. Ilmuwan Data memilih Pandas sebagai alat terbaik yang tersedia untuk analisis dan manipulasi data.
Apa saja fitur penting yang disediakan oleh Python Pandas?
Untuk memanfaatkan kekuatan sebenarnya dari perpustakaan Pandas dengan Python, Anda harus menjelajahi beberapa fitur penting yang ditawarkan kepada pengguna. Dalam hal analisis data, Pandas dianggap sebagai alat yang paling kuat dengan banyak fitur untuk mempermudah pengguna.
Beberapa fitur penting yang harus Anda ketahui sebelum memulai penggunaan dengan perpustakaan Pandas adalah:
1. Penanganan data
2. Penyelarasan dan pengindeksan data
3. Pembersihan data
4. Menangani data yang hilang
5. Berbagai alat input dan output untuk membaca dan menulis data
6. Mendukung berbagai format file
7. Gabungkan dan gabungkan kumpulan data yang berbeda
8. Optimalisasi kinerja
9. Visualisasi data
10. Mengelompokkan data sesuai kebutuhan
11. Melakukan operasi matematika yang berbeda pada data yang tersedia
12. Menyembunyikan data yang tidak relevan untuk hanya menggunakan data yang diperlukan
13. Mengambil data unik dari berbagai pengulangan dalam dataset
Apa alasan di balik mengimpor perpustakaan Pandas dengan Python?
Pandas adalah pustaka Python sumber terbuka yang paling banyak digunakan untuk melakukan berbagai tugas analisis data, ilmu data, dan pembelajaran mesin. Pandas adalah paket paling populer untuk perselisihan data, dan bekerja cukup baik dengan berbagai modul ilmu data lainnya di ekosistem Python. Pustaka Pandas adalah preferensi pertama untuk apa pun dalam hal data untuk setiap profesional ilmu data dan analisis data.