Bilmeniz Gereken En İyi Python Veri Görselleştirme Kitaplıkları

Yayınlanan: 2020-03-20

Python verilerle birçok şey yapabilir. Ve birçok yeteneğinden biri görselleştirmedir. Bu amaçla kullanabileceğiniz birden fazla kütüphaneye sahiptir. Bu makalede, önde gelen kitaplıklarından bazılarına ve bunlar aracılığıyla çizebileceğiniz çeşitli grafiklere bir göz atacağız.

İçindekiler

Python Veri Görselleştirme

Bu makalede birden fazla örnek paylaştık, bunları bir veri kümesi kullanarak denediğinizden emin olun. Başlayalım:

Python Veri Görselleştirme Kitaplıkları

Python'un güzel grafikler oluşturmak için birçok kütüphanesi vardır. Hepsinin performanslarını ve yeteneklerini artıran çeşitli özellikleri vardır. Ve tüm beceri seviyeleri için kullanılabilirler. Bu, ister başlangıç ​​seviyesinde ister ileri düzey bir programcı olun, Python'da veri görselleştirme gerçekleştirebileceğiniz anlamına gelir. Aşağıdakiler bazı önemli kütüphanelerdir:

  • deniz kızı
  • matplotlib
  • pandalar

Veri bilimi için başka birçok python kitaplığı var , ancak şimdilik öne çıkanlara odaklandık. Şimdi bu farklı kitaplıkları tartışacağız ve bunları ve Python'u kullanarak grafikleri nasıl çizebileceğinizi anlayacağız. Başlayalım.

matplotlib

Grafik çizmek için en popüler Python kütüphanesi Matplotlib'dir. Çok fazla deneyim gerektirmez ve yeni başlayanlar için mükemmeldir. Bu kitaplık aracılığıyla veri görselleştirmeyi öğrenmeye başlayabilir ve çeşitli grafikler ve görselleştirmelerde ustalaşabilirsiniz. Size çok fazla özgürlük verir, ancak çok fazla kod yazmanız gerekir.

İnsanlar, çubuk grafikler ve histogramlar gibi basit görselleştirmeler için Matplotlib'i kullanır.

Okuyun : Python'da Veri Çerçeveleri

Çizgi grafik

Çizgi grafiği oluşturmak için 'plot' yöntemini kullanmanız gerekir. Sütunları döngüye alarak grafiğinizde birden çok sütun oluşturabilirsiniz. Bu amaçla aşağıdaki kodu kullanın:

# çizilecek sütunları al

sütunlar = iris.columns.drop(['class'])

# x veri oluştur

x_data = aralık(0, iris.shape[0])

# şekil ve eksen oluştur

incir, balta = plt.subplots()

# her sütunu çiz

sütunlardaki sütun için:

ax.plot(x_data, iris[sütun], etiket=sütun)

# başlığı ve efsaneyi ayarla

ax.set_title('İris Veri Kümesi')

balta.legend()

Dağılım grafiği

'Scatter' yöntemini kullanarak bir dağılım grafiği oluşturabilirsiniz. Plot.subplots üzerinden bir eksen ve şekil oluşturup arsa etiketlerinizi ve başlığınızı vermelisiniz.

Aşağıdaki kodu kullanın:

# bir şekil ve eksen oluşturun

incir, balta = plt.subplots()

# sepal_uzunluğunu sepal_width'e karşı dağıtın

ax.scatter(iris['sepal_length'], iris['sepal_width'])

# bir başlık ve etiketler belirleyin

ax.set_title('İris Veri Kümesi')

ax.set_xlabel('sepal_length')

ax.set_ylabel('sepal_width')

Veri noktalarına sınıflarına göre renk ekleyebilirsiniz. Bu amaçla, sınıftan renge eşlenecek bir sözlük yapmanız gerekecek. Her noktayı bir for döngüsü kullanarak da dağıtırdı.

# renk sözlüğü oluştur

renkler = {'İris-setosa':'r', 'İris-versicolor':'g', 'İris-virginica':'b'}

# bir şekil ve eksen oluşturun

incir, balta = plt.subplots()

# her veri noktasını çiz

aralıktaki i için(len(iris['sepal_length'])):

ax.scatter(iris['sepal_length'][i], iris['sepal_width'][i],color=colors[iris['class'][i]])

# bir başlık ve etiketler belirleyin

ax.set_title('İris Veri Kümesi')

ax.set_xlabel('sepal_length')

ax.set_ylabel('sepal_width')

histogram

Matplotlib'de bir Histogram oluşturmak için 'hist' yöntemini kullanabilirsiniz. Kategorik veriler verirsek, her sınıfın ne sıklıkta gerçekleştiğini hesaplayabilir. Matplotlib'de bir Histogram çizmek için kullanmanız gereken kod:

# şekil ve eksen oluştur

incir, balta = plt.subplots()

# arsa histogramı

ax.hist(wine_reviews['puan'])

# başlığı ve etiketleri ayarla

ax.set_title('Şarap İnceleme Puanları')

ax.set_xlabel('Puanlar')

ax.set_ylabel('Sıklık')

Grafik çubuğu

Matplotlib, farklı grafikler çizmek için kolay yöntemlere sahiptir. Örneğin, bu durumda Matplotlib'de bir çubuk grafik oluşturmak için 'bar' kullanmanız gerekir. Kategorilerin sıklığını otomatik olarak hesaplayamaz, bu nedenle bu sorunu çözmek için 'değer_sayısı' işlevini kullanmanız gerekir. Verilerinizin pek çok türü yoksa çubuk grafik, görselleştirmesi için mükemmel olacaktır.

# bir şekil ve eksen oluşturun

incir, balta = plt.subplots()

# her sınıfın oluşumunu say

veri = wine_reviews['puan'].value_counts()

# x ve y verilerini al

puan = data.index

frekans = veri.değerler

# çubuk grafik oluştur

ax.bar(nokta, frekans)

# başlığı ve etiketleri ayarla

ax.set_title('Şarap İnceleme Puanları')

ax.set_xlabel('Puanlar')

ax.set_ylabel('Sıklık')

pandalar

Pandas, veri analizi ve manipülasyonu için popüler olan bir Python kütüphanesidir. Açık kaynak kodlu bir kütüphane olduğundan ücretsiz olarak kullanabilirsiniz. 2008 yılında pazara girdi ve o zamandan beri veri yapılandırma konusunda en popüler kütüphanelerden biri haline geldi.

Pandalar veri çerçevesini kullanarak verileriniz için kolayca grafikler oluşturabilirsiniz. API'si Matplotlib'den daha gelişmiştir. Bu, Pandalarda Matplotlib'de oluşturduğunuzdan daha az kodla grafikler oluşturabileceğiniz anlamına gelir.

Grafik çubuğu

Pandalarda, bir çubuk grafiği çizmek için 'plot.bar()' yöntemini kullanmanız gerekir. İlk olarak, arsanızdaki oluşumları 'value_count()' aracılığıyla saymanız ve ardından bunları 'sort_index()' ile sıralamanız gerekir. İşte bir çubuk grafik oluşturmak için bir örnek kod:

random_reviews['points'].value_counts().sort_index().plot.bar()

Pandalarda yatay bir çubuk grafik oluşturmak için 'plot.barh()' yöntemini kullanabilirsiniz:

random_reviews['points'].value_counts().sort_index().plot.barh()

Verileri, oluşum sayısı üzerinden de çizebilirsiniz:

random_reviews.groupby(“ülke”).price.mean().sort_values(artan=Yanlış)[:5].plot.bar()

Çizgi grafik

Pandalarda bir çizgi grafiği oluşturmak için '<dataframe>.plot.line()' kullanmanız gerekecek, Pandalarda, otomatik olarak yapabildiğinden, çizim yapmak için ihtiyacınız olan her sütunda dolaşmak zorunda kalmazsınız. Bu özellik Matplotlib'de mevcut değildir. İşte kod:

random.drop(['class'], axis=1).plot.line(title='Rastgele Veri Kümesi')

Dağılım grafiği

Pandalarda “<dataset>.plot.scatter()” kullanarak bir dağılım grafiği oluşturabilirsiniz. Ona, x sütununun ve y sütununun adları olan iki argüman iletmeniz gerekir.

İşte örneği:

random.plot.scatter(x='sepal_length', y='sepal_width', title=”Rastgele Veri Kümesi')

histogram

Pandalarda bir Histogram oluşturmak için 'plot.hist' kullanın. Bunun dışında bu yöntemde pek bir şey yok. Tek bir Histogram veya birden çok Histogram oluşturma seçeneğiniz vardır.

Bir Histogram oluşturmak için aşağıdaki kodu kullanın:

random_reviews['points'].plot.hist()

Birden çok Histogram oluşturmak için şunu kullanın:

random.plot.hist(subplots=Doğru, layout=(2,2), figsize=(10, 10), kutular=20)

deniz kızı

Seaborn, Matplotlib tabanlıdır ve aynı zamanda veri görselleştirme için oldukça popüler bir Python kütüphanesidir. Verilerinizi çizmek için size gelişmiş arayüzler sunar. Birçok özelliği vardır. Gelişmiş yetenekleri, Matplotlib'de ihtiyaç duyacağınızdan çok daha az kod satırıyla harika grafikler oluşturmanıza olanak tanır.

histogram

Çizgi grafik

Seaborn'da bir çizgi grafiği oluşturmak için 'sns.line grafiği' yöntemini kullanabilirsiniz. Çizgilerin eğrilerinin kenarlarını yuvarlamak için 'sns.kdeplot' yöntemini kullanabilirsiniz. Çok fazla aykırı değer varsa, arsanızı oldukça temiz tutar.

sns.lineplot(data=random.drop(['class'], axis=1))

Dağılım grafiği

Seaborn'da '.scatterplot' yöntemiyle bir dağılım grafiği oluşturabilirsiniz. Bu durumda, tıpkı Pandalarda yaptığımız gibi, x ve y sütunlarının adlarını eklemeniz gerekecek. Ama bir fark var. Pandalarda yaptığımız gibi veri üzerindeki işlevi çağıramayız, bu yüzden onu ek bir argüman olarak iletmemiz gerekecek.

sns.scatterplot(x='sepal_length', y='sepal_width', veri=iris)

'Ton' argümanını kullanarak belirli noktaları da vurgulayabilirsiniz. Bu özellik Matplotlib'de bu kadar kolay değil.

sns.scatterplot(x='sepal_length', y='sepal_width', hue='class', veri=iris)

Grafik çubuğu

Seaborn'da bir çubuk grafik oluşturmak için 'sns.countplot' yöntemini kullanabilirsiniz:

sns.countplot(random_reviews['puan'])

Artık Python'da veri görselleştirme için kritik kitaplıkları tartıştığımıza göre, diğer grafik biçimlerine bir göz atabiliriz. Python ve kütüphaneleri, verilerinizi çizmek için çeşitli şekiller oluşturmanıza olanak tanır.

Python'da Diğer Veri Görselleştirme Türleri

Yuvarlak diyagram

Pasta grafikler, bir dairenin farklı bölümlerindeki verileri gösterir. Okulda bir sürü pasta grafiği görmüş olmalısın. Pasta grafikler, verileri yüzde olarak temsil eder. Pasta grafiğin tüm bölümlerinin toplamı %100'e eşit olmalıdır. İşte örnek kod:

plt.pie(df['Yaş'], etiketler = {“A”, “B”, “C”,

“D”, “E”, “F”,

“G”, ​​“H”, “Ben”, “J”},

autopct ='% 1.1f %%', gölge = Doğru)

plt.göster()

plt.pie(df['Gelir'], etiketler = {“A”, “B”, “C”,

“D”, “E”, “F”,

“G”, ​​“H”, “Ben”, “J”},

autopct ='% 1.1f %%', gölge = Doğru)

plt.göster()

plt.pie(df['Satış'], etiketler = {“A”, “B”, “C”,

“D”, “E”, “F”,

“G”, ​​“H”, “Ben”, “J”},

autopct ='% 1.1f %%', gölge = Doğru)

plt.göster()

Kutu Parselleri

Kutu grafikleri minimum, ilk çeyrek, medyan, üçüncü çeyrek ve maksimum istatistiksel verilere dayanmaktadır. Grafik bir kutuya benziyor (daha spesifik olarak, bir dikdörtgen). Bu yüzden 'kutu arsa' adını almıştır. Kutu grafiği oluşturmak için örnek kod:

# Veri çerçevesinin her sayısal özelliği için

df.plot.box()

# bireysel özellik kutusu grafiği

plt.boxplot(df['Gelir'])

plt.göster()

Ayrıca okuyun: Her Python Geliştiricisinin Bilmesi Gereken En İyi 10 Python Aracı

Çözüm

Umarız bu makaleyi faydalı bulmuşsunuzdur. Python ve çeşitli kitaplıkları aracılığıyla çizebileceğiniz birçok grafik türü vardır. Daha önce Python veri görselleştirme yapmadıysanız Matplotlib ile başlamalısınız. Ustalaştıktan sonra, Pandas ve Seaborn gibi daha karmaşık ve gelişmiş veri görselleştirme kitaplıklarına geçebilirsiniz.

Python, veri bilimi hakkında bilgi edinmek istiyorsanız, çalışan profesyoneller için oluşturulan ve 10'dan fazla vaka çalışması ve proje, pratik uygulamalı atölye çalışmaları, endüstri uzmanlarıyla mentorluk sunan IIIT-B & upGrad'ın Veri Biliminde PG Diplomasına göz atın. Sektör danışmanlarıyla bire bir, en iyi firmalarla 400+ saat öğrenim ve iş yardımı.

Python'daki en iyi Veri Görselleştirme kitaplıkları hangileridir?

Veri Görselleştirme, veri analizinin son derece önemli bir parçası olarak kabul edilir. Bunun nedeni, birkaç veri eğilimini ve bilgiyi görsel bir biçimde anlamaktan daha iyi bir yol olmamasıdır. Şirketinizin verilerini yazılı bir biçimde sunarsanız, insanlar bunu sıkıcı bulabilir. Ancak aynısını görsel bir formatta sunarsanız, insanlar kesinlikle buna daha fazla dikkat edeceklerdir.

Veri görselleştirme sürecini basitleştirmek için Python'da size yardımcı olacak belirli kitaplıklar vardır. Herhangi birinin en iyisi olduğunu söyleyemezsiniz çünkü bu tamamen gereksinimlere bağlı olacaktır. Python'daki en iyi veri görselleştirme kitaplıklarından bazıları matplotlib, plotly, seaborn, GGplot ve altair'dir.

Python'daki en iyi çizim kitaplıklarından biri hangisidir?

Veri görselleştirme ve kitaplıkların çizilmesi söz konusu olduğunda işinizi kolaylaştıracak çok sayıda var. Mevcut tüm kütüphaneler arasında Matplotlib'in kullanıcılar tarafından daha iyi olduğu görülmüştür.

Matplotlib daha az yer kaplar ve daha iyi bir çalışma süresine sahiptir. Bunun dışında, kullanıcıların uygulamanın kendisinde grafikler çizmesine izin veren nesne yönelimli bir API de sağlar. Matplotlib, ücretsiz ve açık kaynaklı olmasının yanı sıra birçok çıktı türünü de destekler.

Veri bilimcileri için varsayılan veri görselleştirme kitaplığı hangisidir?

Veri bilimi ile ilgileniyorsanız, Matplotlib kitaplığını zaten kullanmış olma olasılığınız yüksektir. Yeni başlayanlardan deneyimli profesyonellere kadar karmaşık veri görselleştirmeleri oluşturmak için bu kütüphaneyi kullanmayı tercih ettiği görülmüştür.

Çok dikkate alınmasının arkasındaki ana neden, kullanıcılara 2B çizim kitaplığı olarak sağladığı esneklik miktarıdır. MATLAB geçmişiniz varsa, Matplotlib'in Pyplot arayüzünün size oldukça tanıdık geldiğini fark edeceksiniz. Böylece, ilk görselleştirmenize başlamak için fazla zamana ihtiyacınız olmayacak. Kullanıcı, Matplotlib'deki tüm görselleştirmeyi en ayrıntılı seviyeden kontrol edebilir.