Pandalarda Mevcut Veri Çerçevesine Yeni Sütun Ekleme [222]

Yayınlanan: 2021-01-06

Yorumlanmış, genel amaçlı, üst düzey bir programlama dili olan Python, geniş kütüphane koleksiyonu ve uygulanması kolay doğası nedeniyle son zamanlarda olağanüstü bir bilgi işlem dili haline geldi. Python'un popülaritesi, veri bilimi ve veri analitiğinin uygulanmasıyla büyük bir sıçrama yaptı. Python'un herhangi bir dikeyde verimli bir şekilde çalışmasını sağlamak için entegre edilebilecek binlerce kitaplık vardır.

Pandas , Python için açıkça veri işleme ve veri analizi gerçekleştirmesi için tasarlanmış böyle bir veri analizi kitaplığıdır. Pandas kitaplığı, sayısal tablolarla başa çıkmak, verileri analiz etmek ve zaman serileriyle çalışmak için belirli veri yapılarından ve işlemlerden oluşur. Bu makalede, Panda'larda zaten var olan DataFrame'e nasıl sütun ekleneceğini öğreneceksiniz .

Okuyun: Pandas Dataframe Astype

İçindekiler

DataFrame nedir?

Mevcut DataFrame'e nasıl yeni bir sütun ekleneceğini bilmeden önce, Pandalardaki DataFrame'lere bir göz atalım. DataFrame, heterojen değerleri etiketlenmiş eksenlerle (satırlar ve sütunlar) depolayabilen iki boyutlu bir dizi biçimindeki değişken bir veri yapısıdır. DataFrame, verilerin mantıksal bir tablo düzeni (kesişen satırlar ve sütunlar) tarzında saklandığı bir veri yapısıdır. DataFrame'in üç ana bileşeni satırlar, sütunlar ve verilerdir. Python'da DataFrame oluşturmak çok kolaydır.

pandaları pd olarak içe aktar

l = ['Bu', 'is', 'a', 'Liste', 'hazırlanıyor', 'için', 'DataFrame']

datfr = pd.DataFrame(l)

yazdır(datfr)

Yukarıdaki program 7 satır ve bir sütundan oluşan bir DataFrame oluşturacaktır.

Pandalarda mevcut veri çerçevesi

Mevcut DataFrame'lere Sütunlar Nasıl Eklenir?

Pandas'ta bir DataFrame'e yeni sütunlar eklemenin çeşitli yolları vardır. Pandas kitaplığını kullanarak temel bir DataFrame'in nasıl oluşturulacağına dair bir fikri zaten topladık. Şimdi mevcut bir kütüphaneyi hazırlayalım ve üzerinde çalışalım.

pandaları pd olarak içe aktar

# Profesyonellerin verilerini içeren bir sözlük tanımlayın

datfr = {'Ad': ['Karl', 'Gaurav', 'Ray', 'Mimo'],

'Yükseklik': [6.2, 5.7, 6.1, 5.9],

'Görev': ['Bilim Adamı', 'Profesör', 'Veri Analisti', 'Güvenlik Analisti']}

df = pd.DataFrame(datfr)

yazdır(df)

Çıktı:

Okuyun: Python Pandaları Eğitimi

Teknik 1: insert() Yöntemi

Şimdi, mevcut DataFrame'e yeni sütunlar eklemek için insert() yöntemini kullanmamız gerekiyor. insert() yöntemini uygulamadan önce, çalışması hakkında bize bilgi verin. DataFrame.insert(), veri analistinin istediği herhangi bir konuma bir sütun eklemeye izin verir. Ayrıca sütun değerlerini enjekte etmek için çeşitli olasılıkları da barındırır. Programcılar, veri sütununu belirli bir konuma enjekte etmek için dizini belirleyebilir.

pandaları pd olarak içe aktar

# Profesyonellerin verilerini içeren bir sözlük tanımlayın

datfr = {'Ad': ['Karl', 'Gaurav', 'Ray', 'Mimo'],

'Yükseklik': [6.2, 5.7, 6.1, 5.9],

'Görev': ['Bilim Adamı', 'Profesör', 'Veri Analisti', 'Güvenlik Analisti']}

df = pd.DataFrame(datfr)

df.insert(3, “Yaş”, [40, 33, 27, 26], Doğru)

yazdır(df)

İlk parametre olarak insert() yönteminde tanımlandığı gibi üçüncü dizin konumuna 'Yaş' sütununu ekleyecektir.

Teknik 2: assign() Yöntemi

DataFrame'e sütun eklemek için başka bir yöntem de Pandas kitaplığının assign() yöntemini kullanmaktır. Bu yöntem, mevcut DataFrame'e yeni bir sütun eklemek için farklı bir yaklaşım kullanır. Dataframe.assign(), bir sütunla birlikte yeni bir DataFrame oluşturacaktır. Ardından, mevcut DataFrame'e ekleyecektir.

pandaları pd olarak içe aktar

datfr = {'Ad': ['Karl', 'Gaurav', 'Ray', 'Mimo'],

'Yükseklik': [6.2, 5.7, 6.1, 5.9],

'Görev': ['Bilim Adamı', 'Profesör', 'Veri Analisti', 'Güvenlik Analisti']}

dfI = pd.DataFrame(datfr)

dfII = dfI.assign(Konum = ['Noida', 'Amsterdam', 'Cambridge', 'Bangaluru'])

yazdır(dfII)

ÇIKTI:

Teknik 3: Sütun Olarak Yeni Liste Oluşturma

Programcıların DataFrame'e sütun eklemek için kullanabilecekleri son yöntem, ayrı bir veri sütunu olarak yeni bir liste oluşturmak ve sütunu mevcut DataFrame'e eklemektir.

pandaları pd olarak içe aktar

datfr = {'Ad': ['Karl', 'Gaurav', 'Ray', 'Mimo'],

'Yükseklik': [6.2, 5.7, 6.1, 5.9],

'Görev': ['Bilim Adamı', 'Profesör', 'Veri Analisti', 'Güvenlik Analisti']}

df = pd.DataFrame(datfr)

loc = ['Noida', 'Amsterdam', 'Cambridge', 'Bangaluru']

df['Konum'] = yer

yazdır(df)

ÇIKTI:

Ödeme: Pandalar Mülakat Soruları

Çözüm

Veri analistleri, sütun şeklinde bir biçimde fazladan bir veri kümesi eklemek için birincil bir işlem gerçekleştirir. Bir veri analisti veya programcının Pandalarda mevcut bir DataFrame'e yeni bir sütun eklemek için kullanabileceği farklı yaklaşımlar vardır. Bu yöntemler, programcıları Panda verilerini analiz ederken herhangi bir zamanda veri sütunları eklemek için kullanışlı hale getirecektir.

Pandalarda DataFrame hakkında bilgi edinmek istiyorsanız, IIIT-B & upGrad'ın çalışan profesyoneller için oluşturulan ve 10'dan fazla vaka çalışması ve proje, pratik uygulamalı atölye çalışmaları, endüstri uzmanlarıyla mentorluk sunan Veri Biliminde Yönetici PG Programına göz atın. Sektör danışmanlarıyla bire bir, en iyi firmalarla 400+ saat öğrenim ve iş yardımı.

Pandalar neden Python'da veri çerçeveleri oluşturmak için en çok tercih edilen kitaplıklardan biri?

Pandas kitaplığı, veri çerçevesi oluşturmayı verimli hale getiren çeşitli özellikler sağladığı için veri çerçeveleri oluşturmak için en uygun kitap olarak kabul edilir. Bu özelliklerden bazıları aşağıdaki gibidir - Pandalar bize sadece verimli bir veri sunumuna izin vermekle kalmayıp aynı zamanda onu manipüle etmemizi sağlayan çeşitli veri çerçeveleri sağlar. Verileri etiketlemenin ve düzenlemenin akıllı yollarını sağlayan verimli hizalama ve indeksleme özellikleri sağlar. Pandaların bazı özellikleri kodu temiz hale getirir ve okunabilirliğini artırır, böylece daha verimli hale getirir. Ayrıca birden fazla dosya biçimini okuyabilir. JSON, CSV, HDF5 ve Excel, Pandalar tarafından desteklenen dosya biçimlerinden bazılarıdır. Birden çok veri kümesinin birleştirilmesi, birçok programcı için gerçek bir zorluk olmuştur. Pandalar bunun da üstesinden gelir ve birden çok veri setini çok verimli bir şekilde birleştirir. Pandalar ayrıca Matplotlib ve NumPy gibi diğer önemli Python kitaplıklarına erişim sağlar ve bu da onu oldukça verimli bir kitaplık haline getirir.

Pandas kütüphanesinin çalıştığı diğer Python kütüphaneleri nelerdir?

Pandalar yalnızca veri çerçeveleri oluşturmak için merkezi bir kitaplık olarak çalışmakla kalmaz, aynı zamanda daha verimli olmak için Python'un diğer kitaplıkları ve araçlarıyla da çalışır. Pandalar, Pandaların kitaplık yapısının çoğunun NumPy paketinden kopyalandığını gösteren NumPy Python paketi üzerine kurulmuştur. Pandas kitaplığındaki verilerin istatistiksel analizi, SciPy tarafından, Matplotlib'de işlevlerin çizilmesi ve Scikit-learn'de makine öğrenme algoritmaları tarafından yürütülür. Jupyter Notebook, IDE olarak çalışan ve Pandalar için iyi bir ortam sunan web tabanlı etkileşimli bir ortamdır.

Ekleme ile birlikte Dataframe'in temel işlemleri nelerdir?

Ekleme veya silme gibi herhangi bir işleme başlamadan önce bir dizin veya sütun seçmek önemlidir. Bir Veri Çerçevesinden değerlere nasıl erişeceğinizi ve sütunları nasıl seçeceğinizi öğrendikten sonra, bir Pandas Veri Çerçevesine dizin, satır veya sütun eklemeyi öğrenebilirsiniz. Veri çerçevesindeki indeks istediğiniz gibi çıkmazsa sıfırlayabilirsiniz. Dizini sıfırlamak için “reset_index()” işlevini kullanabilirsiniz.