Pandalar İçin Okunması Gereken 17 Mülakat Soruları ve Cevapları [Yeni Başlayanlar ve Deneyimliler İçin]

Yayınlanan: 2020-07-29

Pandas, yüksek performanslı, kullanımı kolay veri yapıları ve veri analiz araçları sunan BSD lisanslı ve açık kaynaklı bir Python kitaplığıdır. Pandalı Python, ekonomi, finans, istatistik, analitik ve daha fazlası dahil olmak üzere çok çeşitli disiplinlerde kullanılır. Bu yazıda, bir python öğrenicisinin bilmesi gereken bazı temel panda röportaj sorularını ve NumPy röportaj sorularını listeledik . Python hakkında daha fazla bilgi edinmek istiyorsanız veri bilimi programlarımıza göz atın.

İçindekiler

Pandalar Röportaj Soruları ve Cevapları

Soru 1 – Python Pandalarını tanımlayın.

Pandalar, verileri analiz etmek ve işlemek için kullanılan Python için açıkça yazılmış bir yazılım kitaplığına atıfta bulunur. Pandas, Wes McKinney tarafından oluşturulan açık kaynaklı, platformlar arası bir kitaplıktır. 2008'de piyasaya sürüldü ve sayısal ve zaman serisi verilerini işlemek için veri yapıları ve işlemler sağladı. Pandalar, pip veya Anaconda dağıtımı kullanılarak kurulabilir. Pandalar, tablo verileri üzerinde makine öğrenimi işlemlerini gerçekleştirmeyi çok kolaylaştırır.

Soru 2 – Pandalardaki Farklı Veri Yapısı Türleri Nelerdir?

Panda kitaplığı iki ana veri yapısı türünü destekler, DataFrame'ler ve Seriler. Bu veri yapılarının her ikisi de NumPy'nin üzerine inşa edilmiştir. Seri, tek boyutlu ve en basit bir veri yapısıdır, DataFrame ise iki boyutludur. “Panel” olarak bilinen başka bir eksen etiketi, 3 boyutlu bir veri yapısıdır ve majör_eksen ve minör_eksen gibi öğeleri içerir.

Kaynak

Soru 3 – Pandalarda Serileri Açıklayın.

Seri, herhangi bir türdeki (dize, kayan nokta, tamsayı, python nesneleri vb.) veri değerlerini tutabilen tek boyutlu bir dizidir. Pandalardaki en basit veri yapısı türüdür; burada verinin eksen etiketlerine indeks adı verilir.

Soru 4 – Pandalarda Veri Çerçevesini Tanımlayın.

DataFrame, verilerin satırlar ve sütunlarla tablo biçiminde hizalandığı 2 boyutlu bir dizidir. Bu yapı ile satır ve sütunlar üzerinde aritmetik işlem yapabilirsiniz.

Soru 5 – Pandalarda Nasıl Boş Bir Veri Çerçevesi Oluşturabilirsiniz?

Pandalarda boş bir DataFrame oluşturmak için şunu yazın

pandaları pd olarak içe aktar

ab = pd.DataFrame()

Soru 6 – Pandalar Kütüphanesinin En Önemli Özellikleri Nelerdir?

Panda kütüphanesinin önemli özellikleri şunlardır:

  • Veri Hizalama
  • Birleştir ve katıl
  • Verimli Bellek
  • Zaman serisi
  • yeniden şekillendirme

Okuyun: Apache PySpark'ta Veri Çerçevesi: Kapsamlı Eğitim

Soru 7 – Pandalarda Yeniden İndekslemeyi Nasıl Açıklayacaksınız?

Yeniden indekslemek, verileri belirli bir eksen boyunca belirli bir etiket kümesiyle eşleşecek şekilde değiştirmek anlamına gelir.

İndeksleme kullanılarak çeşitli işlemler gerçekleştirilebilir, örneğin:

  • Etiket için hiçbir verinin bulunmadığı etiket konumlarına eksik değer (NA) işaretçileri ekleyin.
  • Yeni bir etiket kümesiyle eşleşmesi için mevcut veri kümesini yeniden sıralayın.

Soru 8 – Pandalarda DataFrame oluşturmanın farklı yolları nelerdir? Örneklerle açıklayınız.

DataFrame, nd dizilerinin Listeleri veya Dict'i kullanılarak oluşturulabilir.

Örnek 1 – Listeyi Kullanarak DataFrame Oluşturma

pandaları pd olarak içe aktar

# dizelerin bir listesi

Strlist = ['Pandalar', 'NumPy']

# Listedeki DataFrame yapıcısını çağırma

liste = pd.DataFrame(Strlist)

yazdır(liste)

Örnek 2 – Dizilerin diktesini kullanarak bir DataFrame oluşturma

pandaları pd olarak içe aktar

list = {'Kimlik': [1001, 1002, 1003],'Departman':['Bilim', 'Ticaret', 'Sanat',]}

liste = pd.DataFrame(liste)

yazdır (liste)

Kontrol edin: Veri Bilimi Mülakat Soruları

Soru 9 – Pandalarda Kategorik Verileri Açıklayın ?

Kategorik veriler, tekrarlanabilen gerçek zamanlı verileri ifade eder; örneğin ülke, cinsiyet, kodlar gibi kategoriler altındaki veri değerleri her zaman tekrarlayıcı olacaktır. Pandalardaki kategorik değerler de yalnızca sınırlı ve sabit sayıda olası değer alabilir.

Bu tür veriler üzerinde sayısal işlemler yapılamaz. Pandalardaki kategorik verilerin tüm değerleri ya kategorilerde ya da np.nan'dadır.

Bu veri türü aşağıdaki durumlarda faydalı olabilir:

Bir dize değişkeni yalnızca birkaç farklı değer içeriyorsa, onu kategorik bir değişkene dönüştürmek biraz bellek tasarrufu sağlayabilir.

Bu sütunun kategorik bir değişken olarak ele alınması gerektiğinden, diğer Python kitaplıklarına bir sinyal olarak yararlıdır.

Sözlüksel bir sıra, mantıksal bir sıra gibi, doğru sıralanması için kategorik bir sıraya dönüştürülebilir.

Soru 10 – Pandalarda Dict Kullanarak Bir Dizi Oluşturun.

pandaları pd olarak içe aktar

numpy'yi np olarak içe aktar

ser = {'a' : 1, 'b' : 2, 'c' : 3}

ans = pd.Series(ser)

yazdır

Soru 11 – Pandalarda Dizinin Kopyası Nasıl Oluşturulur?

Pandalarda dizinin bir kopyasını oluşturmak için aşağıdaki sözdizimi kullanılır:

pandas.Series.copy

Series.copy(derin=Doğru)

* deep değeri false olarak ayarlanırsa ne veriyi ne de indeksleri kopyalamaz.

Soru 12 – Pandalarda Bir Veri Çerçevesine Nasıl İndeks, Satır veya Sütun Eklersiniz?

Bir DataFrame'e satır eklemek için .loc(), .iloc() ve .ix() kullanabiliriz. .loc() etiket tabanlıdır, .iloc() tamsayı tabanlıdır ve .ix() kabin etiketi ve tamsayı tabanlıdır. DataFrame'e sütun eklemek için tekrar .loc() veya .iloc() kullanabiliriz.

Soru 13 – Pandas Dataframe Dizini veya Sütunlarını Yeniden Adlandırmak İçin Hangi Yöntemi Kullanacaksınız?

.rename yöntemi, DataFrame'in sütunlarını veya dizin değerlerini yeniden adlandırmak için kullanılabilir

Soru 14 – Pandalarda Veri Çerçevesini Nasıl Yineleyebilirsiniz?

Pandalarda DataFrame üzerinde yineleme yapmak için döngü için bir iterrows() çağrısı ile birlikte kullanılabilir.

Soru 15 – Pandas Numpy Dizisi Nedir?

Sayısal Python (NumPy), çok boyutlu ve tek boyutlu dizi öğelerinin sayısal hesaplamalarını ve işlenmesini gerçekleştirmek için python'da yerleşik bir paket olarak tanımlanır.

NumPy dizisi, diğer Python dizilerine kıyasla daha hızlı hesaplar.

Soru 16 – Bir Dataframe Nasıl Excel Dosyasına Dönüştürülebilir?

Tek bir nesneyi bir excel dosyasına dönüştürmek için hedef dosyanın adını belirtmemiz yeterlidir. Ancak, birden çok sayfayı dönüştürmek için, hedef dosya adıyla birlikte bir ExcelWriter nesnesi oluşturmamız ve dışa aktarmak istediğimiz sayfayı belirtmemiz gerekiyor.

Soru 17 – Pandalarda Groupby İşlevi Nedir?

Pandalarda groupby () işlevi, programcıların verileri gerçek dünya setlerinde kullanarak yeniden düzenlemesine olanak tanır. Fonksiyonun birincil görevi, verileri çeşitli gruplara bölmektir.

Ayrıca Okuyun: En İyi 15 Python Yapay Zeka ve Makine Öğrenimi Açık Kaynak Projesi

Çözüm

Yukarıda bahsedilen P andas mülakat sorularının ve NumPy mülakat sorularının gelecek mülakat oturumlarınıza hazırlanmanıza yardımcı olacağını umuyoruz. Python diline hakim olmanıza yardımcı olabilecek kurslar arıyorsanız , upGrad en iyi platform olabilir.

Veri bilimi hakkında bilgi edinmek istiyorsanız, IIIT-B & upGrad'ın çalışan profesyoneller için oluşturulmuş ve 10'dan fazla vaka çalışması ve proje, uygulamalı uygulamalı atölye çalışmaları, endüstri uzmanlarıyla mentorluk, 1 Endüstri danışmanlarıyla bire bir, en iyi firmalarla 400+ saat öğrenim ve iş yardımı.

Pandalar kütüphanesi hangi amaçla kullanılır?

Pandaların kullanılmasının ana nedeni veri analizi içindir. Pandalar, kullanıcıların Microsoft Excel, SQL, JSON ve ayrıca virgülle ayrılmış değerler gibi çeşitli biçimlerdeki verileri içe aktarmasına olanak tanır. Pandalar, kullanıcıların seçme, yeniden şekillendirme, birleştirme ve veri temizleme gibi farklı veri işleme işlemlerini gerçekleştirmelerine izin verdiği için veri analizi için çok faydalı olarak kabul edilir. Bunun dışında Pandalar çeşitli veri karıştırma özellikleri de sunar.

Basit bir ifadeyle, Pandaların veri içeren çeşitli zaman alıcı ve tekrarlayan görevleri gerçekleştirmeyi kolaylaştırdığını söyleyebiliriz. Pandalarla kolaylaştırılan görevler şunlardır:

1. Birleştirme ve katılma İstatistikleri
2.analiz Verileri
3. normalleştirme Verileri
4. Veri doldurma
5. temizlik verileri
6. inceleme Verilerin yüklenmesi ve kaydedilmesi
7. Veri görselleştirme

Bunlar, Panda'larla kolaylaştırılan veri işleme görevlerinden sadece birkaçı. Veri Bilimcileri, Pandaları veri analizi ve manipülasyonu için mevcut en iyi araç olarak oyluyor.

Python Pandaları tarafından sağlanan temel özelliklerden bazıları nelerdir?

Python'daki Pandas kitaplığının gerçek gücünden yararlanmak için, kullanıcılara sunulan bazı temel özellikleri keşfetmeniz gerekir. Veri analizi söz konusu olduğunda, Pandalar, kullanıcılar için işleri kolaylaştıran birçok özelliğe sahip en güçlü araç olarak kabul edilir.

Pandas kütüphanesini kullanmaya başlamadan önce bilmeniz gereken bazı temel özellikler şunlardır:

1. Veri işleme
2. Veri hizalama ve indeksleme
3. Veri temizleme
4. Eksik verileri işleme
5. Verileri okumak ve yazmak için çeşitli giriş ve çıkış araçları
6. Çoklu dosya formatlarını destekler
7. Farklı veri kümelerini birleştirin ve birleştirin
8. Performans optimizasyonu
9. Veri görselleştirme
10. Verileri ihtiyaca göre gruplama
11. Mevcut veriler üzerinde farklı matematiksel işlemler yapmak
12. Yalnızca gerekli verileri kullanmak için alakasız verilerin maskelenmesi
13. Veri kümesindeki çeşitli tekrarlardan benzersiz verilerin çıkarılması

Python'da Pandas kitaplığını içe aktarmanın nedeni nedir?

Pandas, çeşitli veri analizi, veri bilimi ve makine öğrenimi görevlerini gerçekleştirmek için en yaygın kullanılan açık kaynaklı Python kitaplığıdır. Pandalar, veri tartışması için en popüler pakettir ve Python ekosistemindeki diğer çeşitli veri bilimi modülleriyle oldukça iyi çalışır. Pandas kütüphanesi, her veri bilimi ve veri analizi uzmanı için veri söz konusu olduğunda her şey için ilk tercihtir.