Bilmeniz Gereken En İyi Python Veri Görselleştirme Kitaplıkları
Yayınlanan: 2020-03-20Python verilerle birçok şey yapabilir. Ve birçok yeteneğinden biri görselleştirmedir. Bu amaçla kullanabileceğiniz birden fazla kütüphaneye sahiptir. Bu makalede, önde gelen kitaplıklarından bazılarına ve bunlar aracılığıyla çizebileceğiniz çeşitli grafiklere bir göz atacağız.
İçindekiler
Python Veri Görselleştirme
Bu makalede birden fazla örnek paylaştık, bunları bir veri kümesi kullanarak denediğinizden emin olun. Başlayalım:
Python Veri Görselleştirme Kitaplıkları
Python'un güzel grafikler oluşturmak için birçok kütüphanesi vardır. Hepsinin performanslarını ve yeteneklerini artıran çeşitli özellikleri vardır. Ve tüm beceri seviyeleri için kullanılabilirler. Bu, ister başlangıç seviyesinde ister ileri düzey bir programcı olun, Python'da veri görselleştirme gerçekleştirebileceğiniz anlamına gelir. Aşağıdakiler bazı önemli kütüphanelerdir:
- deniz kızı
- matplotlib
- pandalar
Veri bilimi için başka birçok python kitaplığı var , ancak şimdilik öne çıkanlara odaklandık. Şimdi bu farklı kitaplıkları tartışacağız ve bunları ve Python'u kullanarak grafikleri nasıl çizebileceğinizi anlayacağız. Başlayalım.
matplotlib
Grafik çizmek için en popüler Python kütüphanesi Matplotlib'dir. Çok fazla deneyim gerektirmez ve yeni başlayanlar için mükemmeldir. Bu kitaplık aracılığıyla veri görselleştirmeyi öğrenmeye başlayabilir ve çeşitli grafikler ve görselleştirmelerde ustalaşabilirsiniz. Size çok fazla özgürlük verir, ancak çok fazla kod yazmanız gerekir.
İnsanlar, çubuk grafikler ve histogramlar gibi basit görselleştirmeler için Matplotlib'i kullanır.
Okuyun : Python'da Veri Çerçeveleri
Çizgi grafik
Çizgi grafiği oluşturmak için 'plot' yöntemini kullanmanız gerekir. Sütunları döngüye alarak grafiğinizde birden çok sütun oluşturabilirsiniz. Bu amaçla aşağıdaki kodu kullanın:
# çizilecek sütunları al
sütunlar = iris.columns.drop(['class'])
# x veri oluştur
x_data = aralık(0, iris.shape[0])
# şekil ve eksen oluştur
incir, balta = plt.subplots()
# her sütunu çiz
sütunlardaki sütun için:
ax.plot(x_data, iris[sütun], etiket=sütun)
# başlığı ve efsaneyi ayarla
ax.set_title('İris Veri Kümesi')
balta.legend()
Dağılım grafiği
'Scatter' yöntemini kullanarak bir dağılım grafiği oluşturabilirsiniz. Plot.subplots üzerinden bir eksen ve şekil oluşturup arsa etiketlerinizi ve başlığınızı vermelisiniz.
Aşağıdaki kodu kullanın:
# bir şekil ve eksen oluşturun
incir, balta = plt.subplots()
# sepal_uzunluğunu sepal_width'e karşı dağıtın
ax.scatter(iris['sepal_length'], iris['sepal_width'])
# bir başlık ve etiketler belirleyin
ax.set_title('İris Veri Kümesi')
ax.set_xlabel('sepal_length')
ax.set_ylabel('sepal_width')
Veri noktalarına sınıflarına göre renk ekleyebilirsiniz. Bu amaçla, sınıftan renge eşlenecek bir sözlük yapmanız gerekecek. Her noktayı bir for döngüsü kullanarak da dağıtırdı.
# renk sözlüğü oluştur
renkler = {'İris-setosa':'r', 'İris-versicolor':'g', 'İris-virginica':'b'}
# bir şekil ve eksen oluşturun
incir, balta = plt.subplots()
# her veri noktasını çiz
aralıktaki i için(len(iris['sepal_length'])):
ax.scatter(iris['sepal_length'][i], iris['sepal_width'][i],color=colors[iris['class'][i]])
# bir başlık ve etiketler belirleyin
ax.set_title('İris Veri Kümesi')
ax.set_xlabel('sepal_length')
ax.set_ylabel('sepal_width')
histogram
Matplotlib'de bir Histogram oluşturmak için 'hist' yöntemini kullanabilirsiniz. Kategorik veriler verirsek, her sınıfın ne sıklıkta gerçekleştiğini hesaplayabilir. Matplotlib'de bir Histogram çizmek için kullanmanız gereken kod:
# şekil ve eksen oluştur
incir, balta = plt.subplots()
# arsa histogramı
ax.hist(wine_reviews['puan'])
# başlığı ve etiketleri ayarla
ax.set_title('Şarap İnceleme Puanları')
ax.set_xlabel('Puanlar')
ax.set_ylabel('Sıklık')
Grafik çubuğu
Matplotlib, farklı grafikler çizmek için kolay yöntemlere sahiptir. Örneğin, bu durumda Matplotlib'de bir çubuk grafik oluşturmak için 'bar' kullanmanız gerekir. Kategorilerin sıklığını otomatik olarak hesaplayamaz, bu nedenle bu sorunu çözmek için 'değer_sayısı' işlevini kullanmanız gerekir. Verilerinizin pek çok türü yoksa çubuk grafik, görselleştirmesi için mükemmel olacaktır.
# bir şekil ve eksen oluşturun
incir, balta = plt.subplots()
# her sınıfın oluşumunu say
veri = wine_reviews['puan'].value_counts()
# x ve y verilerini al
puan = data.index
frekans = veri.değerler
# çubuk grafik oluştur
ax.bar(nokta, frekans)
# başlığı ve etiketleri ayarla
ax.set_title('Şarap İnceleme Puanları')
ax.set_xlabel('Puanlar')
ax.set_ylabel('Sıklık')
pandalar
Pandas, veri analizi ve manipülasyonu için popüler olan bir Python kütüphanesidir. Açık kaynak kodlu bir kütüphane olduğundan ücretsiz olarak kullanabilirsiniz. 2008 yılında pazara girdi ve o zamandan beri veri yapılandırma konusunda en popüler kütüphanelerden biri haline geldi.
Pandalar veri çerçevesini kullanarak verileriniz için kolayca grafikler oluşturabilirsiniz. API'si Matplotlib'den daha gelişmiştir. Bu, Pandalarda Matplotlib'de oluşturduğunuzdan daha az kodla grafikler oluşturabileceğiniz anlamına gelir.
Grafik çubuğu
Pandalarda, bir çubuk grafiği çizmek için 'plot.bar()' yöntemini kullanmanız gerekir. İlk olarak, arsanızdaki oluşumları 'value_count()' aracılığıyla saymanız ve ardından bunları 'sort_index()' ile sıralamanız gerekir. İşte bir çubuk grafik oluşturmak için bir örnek kod:

random_reviews['points'].value_counts().sort_index().plot.bar()
Pandalarda yatay bir çubuk grafik oluşturmak için 'plot.barh()' yöntemini kullanabilirsiniz:
random_reviews['points'].value_counts().sort_index().plot.barh()
Verileri, oluşum sayısı üzerinden de çizebilirsiniz:
random_reviews.groupby(“ülke”).price.mean().sort_values(artan=Yanlış)[:5].plot.bar()
Çizgi grafik
Pandalarda bir çizgi grafiği oluşturmak için '<dataframe>.plot.line()' kullanmanız gerekecek, Pandalarda, otomatik olarak yapabildiğinden, çizim yapmak için ihtiyacınız olan her sütunda dolaşmak zorunda kalmazsınız. Bu özellik Matplotlib'de mevcut değildir. İşte kod:
random.drop(['class'], axis=1).plot.line(title='Rastgele Veri Kümesi')
Dağılım grafiği
Pandalarda “<dataset>.plot.scatter()” kullanarak bir dağılım grafiği oluşturabilirsiniz. Ona, x sütununun ve y sütununun adları olan iki argüman iletmeniz gerekir.
İşte örneği:
random.plot.scatter(x='sepal_length', y='sepal_width', title=”Rastgele Veri Kümesi')
histogram
Pandalarda bir Histogram oluşturmak için 'plot.hist' kullanın. Bunun dışında bu yöntemde pek bir şey yok. Tek bir Histogram veya birden çok Histogram oluşturma seçeneğiniz vardır.
Bir Histogram oluşturmak için aşağıdaki kodu kullanın:
random_reviews['points'].plot.hist()
Birden çok Histogram oluşturmak için şunu kullanın:
random.plot.hist(subplots=Doğru, layout=(2,2), figsize=(10, 10), kutular=20)
deniz kızı
Seaborn, Matplotlib tabanlıdır ve aynı zamanda veri görselleştirme için oldukça popüler bir Python kütüphanesidir. Verilerinizi çizmek için size gelişmiş arayüzler sunar. Birçok özelliği vardır. Gelişmiş yetenekleri, Matplotlib'de ihtiyaç duyacağınızdan çok daha az kod satırıyla harika grafikler oluşturmanıza olanak tanır.
histogram
Çizgi grafik
Seaborn'da bir çizgi grafiği oluşturmak için 'sns.line grafiği' yöntemini kullanabilirsiniz. Çizgilerin eğrilerinin kenarlarını yuvarlamak için 'sns.kdeplot' yöntemini kullanabilirsiniz. Çok fazla aykırı değer varsa, arsanızı oldukça temiz tutar.
sns.lineplot(data=random.drop(['class'], axis=1))
Dağılım grafiği
Seaborn'da '.scatterplot' yöntemiyle bir dağılım grafiği oluşturabilirsiniz. Bu durumda, tıpkı Pandalarda yaptığımız gibi, x ve y sütunlarının adlarını eklemeniz gerekecek. Ama bir fark var. Pandalarda yaptığımız gibi veri üzerindeki işlevi çağıramayız, bu yüzden onu ek bir argüman olarak iletmemiz gerekecek.
sns.scatterplot(x='sepal_length', y='sepal_width', veri=iris)
'Ton' argümanını kullanarak belirli noktaları da vurgulayabilirsiniz. Bu özellik Matplotlib'de bu kadar kolay değil.
sns.scatterplot(x='sepal_length', y='sepal_width', hue='class', veri=iris)
Grafik çubuğu
Seaborn'da bir çubuk grafik oluşturmak için 'sns.countplot' yöntemini kullanabilirsiniz:
sns.countplot(random_reviews['puan'])
Artık Python'da veri görselleştirme için kritik kitaplıkları tartıştığımıza göre, diğer grafik biçimlerine bir göz atabiliriz. Python ve kütüphaneleri, verilerinizi çizmek için çeşitli şekiller oluşturmanıza olanak tanır.
Python'da Diğer Veri Görselleştirme Türleri
Yuvarlak diyagram
Pasta grafikler, bir dairenin farklı bölümlerindeki verileri gösterir. Okulda bir sürü pasta grafiği görmüş olmalısın. Pasta grafikler, verileri yüzde olarak temsil eder. Pasta grafiğin tüm bölümlerinin toplamı %100'e eşit olmalıdır. İşte örnek kod:
plt.pie(df['Yaş'], etiketler = {“A”, “B”, “C”,
“D”, “E”, “F”,
“G”, “H”, “Ben”, “J”},
autopct ='% 1.1f %%', gölge = Doğru)
plt.göster()
plt.pie(df['Gelir'], etiketler = {“A”, “B”, “C”,
“D”, “E”, “F”,
“G”, “H”, “Ben”, “J”},
autopct ='% 1.1f %%', gölge = Doğru)
plt.göster()
plt.pie(df['Satış'], etiketler = {“A”, “B”, “C”,
“D”, “E”, “F”,
“G”, “H”, “Ben”, “J”},
autopct ='% 1.1f %%', gölge = Doğru)
plt.göster()
Kutu Parselleri
Kutu grafikleri minimum, ilk çeyrek, medyan, üçüncü çeyrek ve maksimum istatistiksel verilere dayanmaktadır. Grafik bir kutuya benziyor (daha spesifik olarak, bir dikdörtgen). Bu yüzden 'kutu arsa' adını almıştır. Kutu grafiği oluşturmak için örnek kod:
# Veri çerçevesinin her sayısal özelliği için
df.plot.box()
# bireysel özellik kutusu grafiği
plt.boxplot(df['Gelir'])
plt.göster()
Ayrıca okuyun: Her Python Geliştiricisinin Bilmesi Gereken En İyi 10 Python Aracı
Çözüm
Umarız bu makaleyi faydalı bulmuşsunuzdur. Python ve çeşitli kitaplıkları aracılığıyla çizebileceğiniz birçok grafik türü vardır. Daha önce Python veri görselleştirme yapmadıysanız Matplotlib ile başlamalısınız. Ustalaştıktan sonra, Pandas ve Seaborn gibi daha karmaşık ve gelişmiş veri görselleştirme kitaplıklarına geçebilirsiniz.
Python, veri bilimi hakkında bilgi edinmek istiyorsanız, çalışan profesyoneller için oluşturulan ve 10'dan fazla vaka çalışması ve proje, pratik uygulamalı atölye çalışmaları, endüstri uzmanlarıyla mentorluk sunan IIIT-B & upGrad'ın Veri Biliminde PG Diplomasına göz atın. Sektör danışmanlarıyla bire bir, en iyi firmalarla 400+ saat öğrenim ve iş yardımı.
Python'daki en iyi Veri Görselleştirme kitaplıkları hangileridir?
Veri Görselleştirme, veri analizinin son derece önemli bir parçası olarak kabul edilir. Bunun nedeni, birkaç veri eğilimini ve bilgiyi görsel bir biçimde anlamaktan daha iyi bir yol olmamasıdır. Şirketinizin verilerini yazılı bir biçimde sunarsanız, insanlar bunu sıkıcı bulabilir. Ancak aynısını görsel bir formatta sunarsanız, insanlar kesinlikle buna daha fazla dikkat edeceklerdir.
Veri görselleştirme sürecini basitleştirmek için Python'da size yardımcı olacak belirli kitaplıklar vardır. Herhangi birinin en iyisi olduğunu söyleyemezsiniz çünkü bu tamamen gereksinimlere bağlı olacaktır. Python'daki en iyi veri görselleştirme kitaplıklarından bazıları matplotlib, plotly, seaborn, GGplot ve altair'dir.
Python'daki en iyi çizim kitaplıklarından biri hangisidir?
Veri görselleştirme ve kitaplıkların çizilmesi söz konusu olduğunda işinizi kolaylaştıracak çok sayıda var. Mevcut tüm kütüphaneler arasında Matplotlib'in kullanıcılar tarafından daha iyi olduğu görülmüştür.
Matplotlib daha az yer kaplar ve daha iyi bir çalışma süresine sahiptir. Bunun dışında, kullanıcıların uygulamanın kendisinde grafikler çizmesine izin veren nesne yönelimli bir API de sağlar. Matplotlib, ücretsiz ve açık kaynaklı olmasının yanı sıra birçok çıktı türünü de destekler.
Veri bilimcileri için varsayılan veri görselleştirme kitaplığı hangisidir?
Veri bilimi ile ilgileniyorsanız, Matplotlib kitaplığını zaten kullanmış olma olasılığınız yüksektir. Yeni başlayanlardan deneyimli profesyonellere kadar karmaşık veri görselleştirmeleri oluşturmak için bu kütüphaneyi kullanmayı tercih ettiği görülmüştür.
Çok dikkate alınmasının arkasındaki ana neden, kullanıcılara 2B çizim kitaplığı olarak sağladığı esneklik miktarıdır. MATLAB geçmişiniz varsa, Matplotlib'in Pyplot arayüzünün size oldukça tanıdık geldiğini fark edeceksiniz. Böylece, ilk görselleştirmenize başlamak için fazla zamana ihtiyacınız olmayacak. Kullanıcı, Matplotlib'deki tüm görselleştirmeyi en ayrıntılı seviyeden kontrol edebilir.