Pandas Dataframe Astype: Sözdizimi, Veri Tipleri, Dataframe Oluşturma
Yayınlanan: 2020-08-28Python, veri işleme ve analiz amacıyla çeşitli endüstrilerde en çok kullanılan dillerden biridir. Python'un popülaritesinin arkasındaki en büyük neden, geliştiricilerin verileri korumasını ve izlemesini kolaylaştıran geniş kitaplık kümesidir. Python için yazılmış böyle bir kitaplık Pandas'tır . Özellikle Pandas kütüphanesi, zaman serilerini ve tabloları manipüle etmek için kullanılır. Pandalar hakkında daha fazla bilgi edinmek için veri bilimi kurslarımıza göz atın.
Pandalar DataFrame . astype () veya bazen astype () olarak da adlandırılan yöntem , panda nesnelerini bir dtype'a dönüştürmek için kullanılır. astype () işlevi. Bir tablonun bir veya birden çok sütununun veri türünü diğerine dönüştürmemiz gerektiğinde özellikle çok kullanışlıdır.
İçindekiler
Pandaların Sözdizimi DataFrame.astype()
İlk olarak, sözdizimini tartışmadan önce, aşağıdakiler tarafından yapılan Pandas kitaplığını içe aktarmamız gerekir:
pandaları pd olarak içe aktar
DataFrame sözdizimi. astype () yöntemi:
DataFrame.astype(dtype, kopya=Doğru, hatalar='yükselt', **kwargs)
parametreler
Tanım
Varsayılan değer
tip
Tüm nesneyi aynı türe dönüştürmek için numpy.dtype veya Python türünü kullanır. Alternatif olarak {col: dtype, ?} da kullanabilir; burada col, sütun etiketidir ve dtype, DataFrame'in bir veya daha fazla sütununu sütuna özgü türlere dönüştürmek için aynı işlevi görür.
tip
kopyala
True olarak ayarlandığında bir kopya döndürür (kopya=yanlış ayarı, değerlerdeki değişiklikleri diğer pandas nesnelerine yayabilir).
Doğru
hatalar
Verilen tür için geçersiz verilerden kaynaklanan istisnaları kontrol eder.
artırmak
kwarglar
Yapıcıya aktarılacak anahtar sözcük bağımsız değişkenleri.
Döndürür : casted: arayan türüne benzer şekilde geri döner.
Okuyun: Python'da Veri Çerçeveleri
Pandalar kitaplığındaki Veri Türleri
Şimdi Pandas DataFrame'den beri. astype () yöntemi, tablolardaki veri türlerini yayınlamak ve değiştirmekle ilgilidir, Pandas kitaplığındaki veri türlerine ve kullanımlarına bakalım .
1. Nesne : Metin veya alfasayısal değerler için kullanılır.
2. Int64 : Tamsayılar için kullanılır.
3. Float64 : Kayan noktalı sayılar için kullanılır.
4. Bool : Doğru/Yanlış değerler için kullanılır.
5. Datetime64 : Tarih ve saat değerleri için kullanılır.
6. Timedelta[ns] : İki tarih arasındaki farklar için kullanılır.
7. Kategori : Metin değerleri listesi için kullanılır.
Pandalar kitaplığında bir DataFrame oluşturma
Bir pandas nesnesinde veri çerçevesi oluşturmanın iki yolu vardır. Bir tablo oluşturabilir veya mevcut bir CSV dosyasını ekleyebiliriz. Mevcut bir dosyayı eklemek için gereken kod:
df = pd.read_csv(“ dosya_adı.csv ”)
Veri çerçevesi için yeni bir tablo oluşturma sözdizimi şöyledir:
t = {'sütun 1': [1, 2], 'sütun 2': [3, 4]}
df = pd.DataFrame(veri=t)
Mutlaka Okuyun: Yeni Başlayanlar İçin Python Panda Eğitimi

Pandas Dataframe.astype() Yöntemini Kullanma
Pandas nesnesine tablo ve veri çerçevesi eklendikten sonra, tablonun bir veya daha fazla sütununun veri türlerini dönüştürmeye başlayabiliriz. Değerlerin veri türlerini dönüştürmeden önce df.dtypes veya df.info() kodunu kullanarak kontrol edebiliriz . Bu kodların her ikisi de tablonun her sütununun veri türlerini görüntüler.
Unutulmaması gereken başka bir şey de DataFrame. astype () yöntemi, veri çerçevesinin nan veya NA değerlerine sahip olması durumunda hata verebilir. Bu yüzden devam etmeden önce, tablodaki tüm nan değerlerini temizlememiz gerekiyor. Nan veya NA değerlerinin bırakılacağı sözdizimi şöyledir:
df.dropna(yerinde = Doğru)
Bir Dataframe'in Tüm Sütunlarını Dönüştürme
Sözdizimi: df. astype (' data_type ').dtypes
Tüm veri çerçevesinin veri türü, 'data_type' içine koyduğumuz değere dönüştürülecektir . '
Bir Veri Çerçevesinin Belirli Sütunlarını Dönüştürme
Sözdizimi: df. astype ({“ col_name ”: ' data_type '}).dtypes
Buradaki "col_name" , girdi olarak bir sütun adı gerektirir. Hangi sütun adını koyarsak koyalım, o sütunun veri türü, ' data_type' içinde sağladığımız değerle değiştirilecektir .
Aynı Anda Birden Çok Sütunu Dönüştürme
Sözdizimi: df. astype ({“ sütun_adı ”: 'veri_türü', “ sütun_adı ”: ' veri_türü ', " sütun_adı ”: ' veri_türü '}).dtypes
Burada tek yaptığımız, dönüştürmek istediğimiz tüm sütunları virgülle ayırmaktı. Sözdizimindeki “ col_name ” ve ' data_type ', tek bir sütunu dönüştürürken gereken değerlerin aynısını gerektirir.
Özetlemek
Pandalar DataFrame bu şekilde . astype () yöntemi kullanılır. Python, Makine Öğrenimi ve Veri Bilimine de adım attığı için şu anda en çok tercih edilen programlama dillerinden biridir. Python'un bu iki alanda nasıl kullanıldığını ve Veri Bilimi alanındaki kariyerinize nasıl yardımcı olabileceğini öğrenmek istiyorsanız, blogumuzda bununla ilgili her şeyi okuyabilirsiniz. Veri Biliminde Yönetici PG Programı veya Machine Learning ve Deep'te PG sertifikası almak için Upgrad'ın web sitesini ziyaret edebilirsiniz .
Pandaları öğrenmek ne kadar zor?
Pandas bir Python paketidir, bu nedenle kullanmaya başlamadan önce Python sözdiziminin temellerini bilmeniz gerekir. Temel panda sözdizimi ilk başta garip görünebilir, ancak pratikle gruplama, işlevleri herhangi bir eksene uygulama, döndürme gibi şeyleri öğrenebilirsiniz. Python'un çok amaçlı doğası, makine öğrenimi sorunlarının da üstesinden gelmek için Pandas kitaplığının oluşturulmasıyla genişletildi.
Pandaların en son sürümünü PC'ye nasıl yükleyebilirim?
pip'in en son sürümünü indirin ve yükleyin
2. Python'un en son sürümünü indirin. Python kurulumunuzla ilgili herhangi bir zorluk yaşamamak için Python kurulumunu bitirdikten sonra yol uzunluğunu devre dışı bırakma seçeneğine tıklayın.
3. Python kurulduğuna göre, komut istemine gitmeli ve oradan Panda'ları yüklemelisiniz. Bu nedenle, masaüstünüzün arama kutusuna gidin ve içine 'cmd' yazın. Komut İstemi adlı bir program görünmelidir. Başlamak için, düğmeye tıklamanız yeterlidir.
4. Şimdi komut isteminde 'pip kurulum yöneticisi' komutunu verin. İndirmenin bitmesini bekleyin, ardından Python uygulamanızın içinden Panda'ları çalıştırabileceksiniz.
Python'da Panda kullanmanın sınırlamaları nelerdir?
Pandaların bazı sözdizimleri, gelişmiş seviyelerini kullanırken karmaşık olabilir. Birçok kullanıcı standart Python kodu ve Pandalar arasında verimli ve sorunsuz bir şekilde hareket edemediği için bu bir sorundur.
2. İlerledikçe ve Pandalar çerçevesi hakkında daha fazla bilgi edindikçe, bazı kavramları anlamakta biraz zorlanabilirsiniz.
3. Pandalar, verileriniz üç boyutlu (3B) bir matrise yükseltildikten sonra pek kullanışlı olmayacaktır ve Pandaların 3B matris uyumluluğu zayıf olduğundan, yardım için NumPy gibi diğer kitaplıklara güvenmeniz gerekecektir.