Pandalar Hile Sayfası: Bilmeniz Gereken En Önemli Komutlar [2022]
Yayınlanan: 2021-01-06Veri analizi, Python sayesinde yeni bir çalışma türü haline geldi. Python üzerinde çalışan ve neredeyse kesinlikle Pandas kütüphanesini kullanan meraklı bir veri analistiyseniz, bu makale tam size göre. Bu Pandas hile sayfası , verileri analiz ederken kullanışlı olan tüm temel yöntemleri gözden geçirecektir. Pandalarda bir şey yapmak için belirli sözdizimini hatırlamanın zor olduğu durumlarla karşılaşmış olabilirsiniz. Bu Panda hile sayfası komutları, en yaygın Panda işlemlerini kolayca hatırlamanıza ve bunlara başvurmanıza yardımcı olacaktır. Python ve veri biliminde yeni başlayan biriyseniz, upGrad'ın veri bilimi kursları, veri ve analitik dünyasının daha derinlerine inmenize kesinlikle yardımcı olabilir.
İçindekiler
Pandalar Hile Sayfasını Kullanma
Bu Pandas hile sayfasını kullanmadan önce , Pandas Eğitimi'ni iyice öğrenmeli ve ardından hatırlama ve temizleme için bu hile sayfasına başvurmalısınız. Pandas hile sayfası , daha önce öğrenmiş olduğunuz yöntemleri hızlıca aramanıza yardımcı olacak ve bir sınava veya mülakata gidiyor olsanız bile kullanışlı olabilir. Pandalarda sıkça kullanılan tüm komutları, kolay tespit için bir veri analisti tarafından topladık ve gruplandırdık. Bu Pandas hile sayfasında , farklı nesneleri temsil etmek için aşağıdaki kısayolu kullanacağız.
- df: Herhangi bir Pandas DataFrame nesnesini temsil etmek için
- ser: Herhangi bir Pandas Series nesnesini temsil etmek için
Bu makalede aşağıda belirtilen yöntemleri uygulamak için aşağıdaki ilgili kütüphaneleri kullanmalısınız.
- pandaları pd olarak içe aktar
- numpy'yi np olarak içe aktar
Mutlaka Okuyun: Pandalar Mülakat Soruları
1. Farklı dosyalardan verileri içe aktarın
- Bir CSV dosyasındaki tüm verileri okumak için: pd.read_csv(file_name)
- Sınırlandırılmış bir metin dosyasından (TSV gibi) tüm verileri okumak için: pd.read_table(file_name)
- Excel sayfasından okumak için: pd.read_excel(file_name)
- Bir SQL veritabanından veri okumak için: pd.read_sql(query, connectionObject)
- JSON formatlı bir dizeden veya URL'den veri alma: pd.read_json(jsonString)
- Panonuzun içeriğini almak için: pd.read_clipboard()
2. DataFrame'leri farklı dosya formatlarında dışa aktarın
- Bir CSV dosyasına DataFrame yazmak için: df.to_csv(file_name)
- Bir Excel dosyasına DataFrame yazmak için: df.to_excel(file_name)
- Bir SQL tablosuna DataFrame yazmak için: df.to_sql(tableName, connectionObject)
- JSON formatında bir dosyaya DataFrame yazmak için: df.to_json(file_name)
3. DataFrame veya Serilerinizin belirli bir bölümünü inceleyin
- Dizin, veri türü ve bellekle ilgili tüm bilgileri almak için: df.info()
- DataFrame'inizin başlangıç 'n' satırlarını çıkarmak için: df.head(n)
- DataFrame'inizin bitiş 'n' satırlarını çıkarmak için: df.tail(n)
- DataFrame'inizde bulunan satır ve sütun sayısını çıkarmak için: df.shape
- Sayısal sütunların istatistiklerini özetlemek için: df.describe()
- Benzersiz değerleri sayılarıyla birlikte görüntülemek için: ser.value_counts(dropna=False)
4. Verilerinizin belirli bir alt kümesini seçme
- İlk satırı çıkarın: df.iloc[0,:]
- DataFrame'inizin ilk sütununun ilk öğesini çıkarmak için: df.iloc[0,0]
- 'col' etiketine sahip sütunları Seri olarak döndürmek için: df[col]
- Yeni bir DataFrame'e sahip sütunları döndürmek için: df[[col1,col2]]
- Pozisyona göre veri seçmek için: ser.iloc[0]
- Dizine göre veri seçmek için: ser.loc['index_one']
5. Veri Temizleme Komutları
- Sütunları kütle olarak yeniden adlandırmak için: df.rename(columns = lambda x: x + 1)
- Sütunları seçerek yeniden adlandırmak için: df.rename(columns = {'oldName': 'newName'})
- Dizini kitleler halinde yeniden adlandırmak için: df.rename(index = lambda x: x + 1)
- Sütunları sırayla yeniden adlandırmak için: df.columns = ['x', 'y', 'z']
- Boş değerlerin olup olmadığını kontrol etmek için buna göre bir boole dizisi döndürür: pd.isnull()
- pd.isnull() işlevinin tersi: pd.notnull()
- Boş değerler içeren tüm satırları bırakır: df.dropna()
- Boş değerler içeren tüm sütunları bırakır: df.dropna(axis=1)
- Her boş değeri 'n' ile değiştirmek için: df.fillna(n)
- Serinin tüm veri tiplerini float'a dönüştürmek için: ser.astype(float)
- 1 numaralı tüm sayıları 'bir' ve 3'ü 'üç' ile değiştirmek için: ser.replace([1,2], ['one','two'])
Ayrıca Okuyun: Pandas Dataframe Astype

6. Verileri Gruplandırma, Sıralama ve Filtreleme
- Sütun değerleri için bir groupby nesnesi döndürmek için: df.groupby(colm)
- Birden çok sütun değeri için groupby nesnesini döndürmek için: df.groupby([colm1, colm2])
- Değerleri artan düzende (sütunlara göre) sıralamak için: df.sort_values(colm1)
- Değerleri azalan düzende (sütunlara göre) sıralamak için: df.sort_values(colm2, artan=Yanlış)
- Sütun değerinin 0,6'dan büyük olduğu satırları çıkarın: df[df[colm] > 0,6]
7. Diğerleri
- İlk DataFrame'in satırlarını ikinci DataFrame'in sonuna ekleyin: df1.append(df2)
- Birinci DataFrame'in sütunlarını ikinci DataFrame'in sonuna ekleyin: pd.concat([df1,df2],axis=1)
- Tüm sütunların ortalamasını döndürmek için: df.mean()
- Null olmayan değerlerin sayısını döndürmek için: df.count()
Çözüm
Bu Panda hile sayfaları yalnızca hızlı hatırlama için faydalı olacaktır. Doğrudan Pandas hile sayfasına geçmeden önce komutları uygulamak her zaman iyi bir yaklaşımdır .
Pandalar hakkında bilgi edinmek istiyorsanız, IIIT-B & upGrad'ın çalışan profesyoneller için oluşturulan ve 10'dan fazla vaka çalışması ve proje, uygulamalı uygulamalı atölye çalışmaları, endüstri uzmanlarıyla mentorluk, 1- endüstri danışmanlarıyla bire bir, en iyi firmalarla 400+ saat öğrenim ve iş yardımı.
Panda kütüphanelerinin göze çarpan özellikleri nelerdir?
Pandaları en popüler Python kitaplıklarından biri yapan özellikler şunlardır: Pandalar bize yalnızca verimli veri gösterimine izin vermekle kalmayıp aynı zamanda onu manipüle etmemizi sağlayan çeşitli veri çerçeveleri sağlar. Verileri etiketlemenin ve düzenlemenin akıllı yollarını sağlayan verimli hizalama ve indeksleme özellikleri sağlar. Pandaların bazı özellikleri kodu temiz hale getirir ve okunabilirliğini artırır, böylece daha verimli hale getirir. Ayrıca birden fazla dosya biçimini okuyabilir. JSON, CSV, HDF5 ve Excel, Pandalar tarafından desteklenen dosya biçimlerinden bazılarıdır. Birden çok veri kümesinin birleştirilmesi, birçok programcı için gerçek bir zorluk olmuştur. Pandalar bunun da üstesinden gelir ve birden çok veri setini çok verimli bir şekilde birleştirir. Pandas kütüphanesi ayrıca Matplotlib ve NumPy gibi diğer önemli Python kütüphanelerine erişim sağlar ve bu da onu oldukça verimli bir kütüphane yapar.
Pandalar kitaplığını tamamlayan diğer kitaplıklar ve araçlar nelerdir?
Pandalar yalnızca veri çerçeveleri oluşturmak için merkezi bir kitaplık olarak çalışmakla kalmaz, aynı zamanda daha verimli olmak için Python'un diğer kitaplıkları ve araçlarıyla da çalışır. Pandalar, Pandaların kitaplık yapısının çoğunun NumPy paketinden kopyalandığını gösteren NumPy Python paketi üzerine kurulmuştur. Pandas kitaplığındaki verilerin istatistiksel analizi, SciPy tarafından, Matplotlib'de işlevlerin çizilmesi ve Scikit-learn'de makine öğrenme algoritmaları tarafından yürütülür. Jupyter Notebook, IDE olarak çalışan ve Pandalar için iyi bir ortam sunan web tabanlı etkileşimli bir ortamdır.
Veri çerçevesinin temel işlemlerini belirtin
Ekleme veya silme gibi herhangi bir işleme başlamadan önce bir dizin veya sütun seçmek önemlidir. Bir Veri Çerçevesinden değerlere nasıl erişeceğinizi ve sütunları nasıl seçeceğinizi öğrendikten sonra, bir Pandas Veri Çerçevesine dizin, satır veya sütun eklemeyi öğrenebilirsiniz. Veri çerçevesindeki indeks istediğiniz gibi çıkmazsa sıfırlayabilirsiniz. Dizini sıfırlamak için “reset_index()” işlevini kullanabilirsiniz.