Pandalar Veri Çerçevelerini Birleştirir [222]

Yayınlanan: 2021-01-06

Analiz yapmak için birleştirmeniz gereken iki veri setine sahip olduğunuzu hayal edin. SQL kullanılırken, bir veritabanındaki iki veya daha fazla tablodan alınan kayıtlar, SQL birleşimleri kullanılarak birleştirilebilir. Benzer şekilde, veri çerçevelerini birleştirmek için Python'da da seçenekler vardır. Peki veri çerçevesi nedir? Python'daki bir veri çerçevesinin birden çok satırı ve sütunu vardır. SQL'deki bir tabloya benzer. Python'da veri analizi için panda yazılım kitaplığına sahipsiniz. Pandalar veri çerçevelerini birleştirir, veri çerçevelerini belirli bir mantığa göre birleştirmemize yardımcı olur.

Veri çerçevelerini birleştirmenin farklı yolları:

  • İç Birleştirme: İç birleştirme, iki kümenin kesişimine oldukça benzer. Bir iç birleştirme durumunda, yalnızca ortak özelliklere sahip olan satırları içeren bir veri çerçevesi döndürülür. Bu nedenle, birleştirilmiş iki veri çerçevesindeki her satır, eşleşen sütun değerlerine sahip olmalıdır.
  • Sol Birleştirme: Bir sol birleştirme, sol veri çerçevesinden tüm satırları ve sağ veri çerçevesinden yalnızca eşleşen satırları döndürür.
  • Sağ Birleştirme: Sağ birleştirme, sağ veri çerçevesinden tüm satırları ve sol veri çerçevesinden yalnızca eşleşen satırları döndürür.
  • Tam veya Dış Birleştirme: Tam birleştirme, hem sol veri çerçevesinden hem de sağ veri çerçevesinden tüm satırları tutar.

Kaynak

Şimdi veri çerçevelerini veya serileri birleştirmek için Pandalarda bulunan fonksiyonlara bakalım.

İçindekiler

Pandalardaki İşlevler

1. Birleştirme işlevi

Okuduğumuz gibi, Python, verileri birleştirmek için kullanılabilen birçok SQL benzeri özelliğe sahiptir. Veri çerçeveleri, adres görevi gören bir dizine sahiptir. Genellikle, satır dizinleri dizin olarak adlandırılırken, sütunlar sütun adlarıyla adreslenir. Birleştirme işlemi, iki veri çerçevesindeki tüm sütunları birleştirmenize olanak tanır. “lsufix” ve “rsuffix” parametrelerini güncelleyerek sol ve sağ sütunu yeniden adlandırabilirsiniz. “Nasıl” parametresini güncelleyerek birleştirme yolunu seçme seçeneğine sahip olursunuz.

Sözdizimi:
DataFrame.join( self , other , on=None , how='right' , lsufix=” , rsuffix=” , sort=False )
Ayrıca Okuyun: Yeni başlayanlar için Python Panda Eğitimi

2. Birleştirme işlevi

Birleştirme işlevi, birleştirme işlemine oldukça benzer. Ancak, iki veri çerçevesindeki tüm sütunları birleştirirken esnek kontrol elde edersiniz. Ortak sütundaki veri çerçevelerini birleştirmek için on = Column Name öğesini kullanabilirsiniz. Sol veya sağ veri çerçevesindeki sütunları anahtar olarak kullanarak tabloları hizalamak için left_on = Column Name veya right_on = Column Name'i güncelleyebilirsiniz. left_index = True veya right_index = True seçimi, sol veri çerçevesinden veya sağ veri çerçevesinden satır etiketlerini birleştirme anahtarları olarak kullanmanıza olanak tanır.

Sözdizimi:

DataFrame.merge( self , right , how='left' , on=None , left_on=None ,

right_on=Yok , left_index=Yanlış , right_index=Yanlış , sort=Yanlış , son ekler=('_x' , '_y') , kopya=Doğru , gösterge=Yanlış , validate=Yok )

Okuyun: Pandalar Mülakat Soruları

3. Birleştirme işlevi

Concat işlevini kullanarak, seçiminize göre sütunlardaki veya satırlardaki verileri birleştirebilirsiniz. Birleştirme mantığını (sol/sağ/iç/tam birleşim) iki eksenden birinde ayarlayabilirsiniz. Ayrıca, yeni birleştirilmiş eksende, doğrulama_integrity kullanılarak yinelenen değerler olup olmadığını kontrol etme seçeneğine de sahip olursunuz. Birleştirme ekseninde herhangi bir indeks değeri belirtilmezse, sonuç ekseni 0,1,… n-1 olarak etiketlenir. Anahtarlar parametresi, geçirilen anahtarları kullanarak hiyerarşik dizin oluşturmanıza olanak tanır.

Sözdizimi

pandas.concat( objs , axis=0 , join='left' , join_axes=None ,

görmezden_index=Yanlış , anahtarlar=Yok , düzeyler=Yok , isimler=Yok ,

doğrulama_integrity=Yanlış , sort=Yok , kopya=Doğru )

Okuyun: Python'da Veri Yapısı Algoritması

Toplama

Pandas.DataFrame'de gördüğümüz gibi, sütunlar üzerinde çalışan veri çerçevelerini birleştirmek için birleştirme ve birleştirme işlevleri kullanılır. Sağlanan son eke göre sütunları yeniden adlandırma seçeneği de vardır. Birleştirme işlevi, satır bazında hizalama durumunda daha fazla esneklik sunar. Aksine, pandaların Concat işlevi, hem satırlarda hem de sütunlarda çalışabilir.

Concat işlevi kullanılırken sütunların yeniden adlandırılması yapılmaz. Pandalar veri çerçevelerini birleştirir, iki veri çerçevesini birleştirmemiz gerektiğinde önemli bir özelliktir. Belirli koşulları kullanarak iki veri çerçevesini birleştirmek, analiz ve diğer görevler için gereken verileri hazırlamanıza yardımcı olur. Bu nedenle, yazılım kitaplığı için pandalar veri çerçevelerini birleştirir, ayrılmaz bir işlevdir.

Pandalarda bulunan çeşitli işlevler hakkında daha fazla bilgi edinmek ve Veri Analizini daha derinlemesine incelemek ister misiniz? upGrad tarafından sunulan Veri Biliminde PG Diplomasını kontrol edebilirsiniz . Kurslar sektör uzmanları tarafından yürütülür ve keşif amaçlı veri analizi, çeşitli veri görselleştirme teknikleri ve Makine Öğrenimi algoritmaları hakkında daha fazla bilgi edinmenize yardımcı olur. upGrad ile Veri Analitiği ve Makine Öğrenimi alanında kariyerinize başlayın.

Pandalardaki farklı eklem türleri nelerdir?

Pandas kitaplığı, veri çerçevelerini birleştirmek için dört çeşit farklı birleştirme sağlar. Bu birleştirmeler aşağıdaki gibidir - İç birleştirme, veri çerçevelerini birleştirmek için en temel birleştirmedir. İç birleştirme, yalnızca ortak özelliklere sahip satırları içeren bir veri çerçevesi döndürür. Bu nedenle, birleştirilmiş veri çerçevelerinin her ikisi de ortak değerlere sahip olmalıdır. Tam veya dış birleştirme, hem sol hem de sağ veri çerçevelerinin tüm satırlarını döndürür. Başka bir deyişle, her iki veri çerçevesinin birliğini sağlar. Sol birleştirme, sağ veri çerçevesinin eşleşen satırlarıyla birlikte sol veri çerçevesinin tüm satırlarını döndürür. Sağ birleştirme, sol birleştirmenin tam tersidir. Sol veri çerçevesinin eşleşen satırlarıyla birlikte sağ veri çerçevesinin tüm satırlarını döndürür.

Satırları veya sütunları birleştirmenin farklı yolları nelerdir?

İki veri çerçevesinin satırları veya sütunları aşağıdaki şekillerde birleştirilebilir: 1. DataFrame'i .concat() kullanarak birleştirme - bu, “.concat()” işlevini kullandığımız iki satırı veya sütunu birleştirmenin en basit yoludur. 2. Eksenlerde mantık ayarlayarak DataFrame'i birleştirme - Bu yöntemde eksenler üzerinde farklı mantık tanımlarız. Eksenleri ayarlamanın yolları şunlardır: Birleşimi alın (birleştirme = dış), kesişimi alın (birleştirme = iç), Belirli bir indeks kullanma. 3. DataFrame'i .append() kullanarak birleştirme - “.append()” işlevi “.concat()” işlevinden hemen önce kullanılır ve eksen = 0 boyunca birleştirir. 4. DataFrame'i dizinleri yok sayarak birleştirme - Bu yöntemde , anlamsız indeksleri yok sayar ve veri çerçevesini ekleriz. Örtüşen indeksleri yok saymak için bir argüman olarak görmezden_index kullanırız.

Birleştirme işlevi hakkında ne biliyorsunuz?

Birleştirme işlevi, satırları veya sütunları birleştirmek için iki veri çerçevesinde çalıştırılır. Yüksek bellekli bir birleştirme işlemidir ve ilişkisel veritabanlarına benzer. Ortak sütundaki veri çerçevelerini birleştirmek için on = Column Name öğesini kullanabilirsiniz.
Sol veya sağ veri çerçevesindeki sütunları anahtar olarak kullanarak tabloları hizalamak için left_on = Column Name veya right_on = Column Name'i güncelleyebilirsiniz. left_index = True veya right_index = True seçimi, sol veri çerçevesinden veya sağ veri çerçevesinden satır etiketlerini birleştirme anahtarları olarak kullanmanıza olanak tanır.