Pustaka Visualisasi Data Python Teratas Yang Harus Anda Ketahui
Diterbitkan: 2020-03-20Python dapat melakukan banyak hal dengan data. Dan salah satu dari banyak kemampuannya adalah visualisasi. Ini memiliki beberapa perpustakaan yang dapat Anda gunakan untuk tujuan ini. Pada artikel ini, kita akan melihat beberapa library yang menonjol dan berbagai grafik yang dapat Anda plot melaluinya.
Daftar isi
Visualisasi Data Python
Kami telah membagikan beberapa contoh dalam artikel ini, pastikan untuk mencobanya dengan menggunakan kumpulan data. Mari kita mulai:
Pustaka Visualisasi Data Python
Python memiliki banyak perpustakaan untuk membuat grafik yang indah. Mereka semua memiliki berbagai fitur yang meningkatkan kinerja dan kemampuannya. Dan mereka tersedia untuk semua tingkat keahlian. Ini berarti Anda dapat melakukan visualisasi data dengan Python, baik Anda seorang pemula atau programmer tingkat lanjut. Berikut ini adalah beberapa perpustakaan terkemuka:
- Yg keturunan dr laut
- Matplotlib
- panda
Ada banyak pustaka python lain untuk ilmu data , tetapi kami telah berfokus pada yang menonjol untuk saat ini. Sekarang kita akan membahas perpustakaan yang berbeda ini dan memahami bagaimana Anda dapat memplot grafik dengan menggunakan mereka dan Python. Mari kita mulai.
Matplotlib
Pustaka Python paling populer untuk merencanakan grafik adalah Matplotlib. Itu tidak membutuhkan banyak pengalaman, dan untuk pemula, itu sempurna. Anda dapat mulai mempelajari visualisasi data melalui perpustakaan ini dan menguasai berbagai grafik dan visualisasi. Ini memberi Anda banyak kebebasan, tetapi Anda juga harus menulis banyak kode.
Orang-orang menggunakan Matplotlib untuk visualisasi sederhana seperti diagram batang dan histogram.
Baca : Data Frame dengan Python
Bagan Garis
Untuk membuat diagram garis, Anda harus menggunakan metode 'plot'. Dengan mengulang kolom, Anda dapat membuat beberapa kolom dalam grafik Anda. Gunakan kode berikut untuk tujuan ini:
# dapatkan kolom untuk diplot
kolom = iris.columns.drop(['kelas'])
# buat data x
x_data = rentang(0, iris.bentuk[0])
# membuat gambar dan sumbu
ara, kapak = plt.subplots()
# plot setiap kolom
untuk kolom dalam kolom:
ax.plot(x_data, iris[kolom], label=kolom)
# atur judul dan legenda
ax.set_title('Set Data Iris')
kapak.legenda()
Plot Pencar
Anda dapat membuat plot pencar menggunakan metode 'scatter'. Anda harus membuat sumbu dan gambar melalui 'plt.subplots' untuk memberikan label plot dan judul.
Gunakan kode berikut:
# membuat gambar dan sumbu
ara, kapak = plt.subplots()
# sebarkan sepal_length terhadap sepal_width
ax.scatter(iris['sepal_length'], iris['sepal_width'])
# tetapkan judul dan label
ax.set_title('Set Data Iris')
ax.set_xlabel('sepal_length')
ax.set_ylabel('sepal_width')
Anda dapat menambahkan warna ke titik data sesuai dengan kelasnya. Untuk tujuan ini, Anda harus membuat kamus yang akan memetakan dari kelas ke warna. Itu akan menyebarkan setiap titik dengan menggunakan for-loop juga.
# buat kamus warna
warna = {'Iris-setosa':'r', 'Iris-versicolor':'g', 'Iris-virginica':'b'}
# membuat gambar dan sumbu
ara, kapak = plt.subplots()
# plot setiap titik data
untuk i in range(len(iris['sepal_length'])):
ax.scatter(iris['sepal_length'][i], iris['sepal_width'][i],color=colors[iris['class'][i]])
# tetapkan judul dan label
ax.set_title('Set Data Iris')
ax.set_xlabel('sepal_length')
ax.set_ylabel('sepal_width')
Histogram
Anda dapat menggunakan metode 'hist' untuk membuat Histogram di Matplotlib. Itu dapat menghitung seberapa sering setiap kelas muncul jika kita memberikannya data kategorikal. Berikut kode yang perlu Anda gunakan untuk memplot Histogram di Matplotlib:
# membuat gambar dan sumbu
ara, kapak = plt.subplots()
# plot histogram
ax.hist(wine_reviews['poin'])
# atur judul dan label
ax.set_title('Skor Ulasan Anggur')
ax.set_xlabel('Poin')
ax.set_ylabel('Frekuensi')
Grafik batang
Matplotlib memiliki metode mudah untuk memplot grafik yang berbeda. Misalnya, dalam hal ini, untuk membuat diagram batang di Matplotlib, Anda harus menggunakan 'batang'. Itu tidak dapat menghitung frekuensi kategori secara otomatis, jadi Anda harus menggunakan fungsi 'value_counts' untuk menyelesaikan masalah ini. Jika data Anda tidak memiliki banyak jenis, maka diagram batang akan sempurna untuk visualisasinya.
# membuat gambar dan sumbu
ara, kapak = plt.subplots()
# hitung kemunculan setiap kelas
data = wine_reviews['points'].value_counts()
# dapatkan data x dan y
poin = data.index
frekuensi = data.nilai
# buat diagram batang
ax.bar(poin, frekuensi)
# atur judul dan label
ax.set_title('Skor Ulasan Anggur')
ax.set_xlabel('Poin')
ax.set_ylabel('Frekuensi')
panda
Pandas adalah pustaka Python yang populer untuk analisis dan manipulasi data. Ini adalah perpustakaan sumber terbuka sehingga Anda dapat menggunakannya secara gratis. Ini memasuki pasar pada tahun 2008, dan sejak itu, telah menjadi salah satu perpustakaan paling populer untuk penataan data.
Dengan menggunakan bingkai data panda, Anda dapat dengan mudah membuat plot untuk data Anda. API-nya lebih maju daripada Matplotlib. Ini berarti Anda dapat membuat grafik dengan lebih sedikit kode di Panda daripada di Matplotlib.
Grafik batang
Di Pandas, Anda harus menggunakan metode 'plot.bar()' untuk memplot diagram batang. Pertama, Anda harus menghitung kejadian di plot Anda melalui 'value_count()' dan kemudian mengurutkannya dengan 'sort_index()'. Berikut adalah contoh kode untuk membuat diagram batang:

random_reviews['points'].value_counts().sort_index().plot.bar()
Anda dapat menggunakan metode 'plot.barh()' untuk membuat diagram batang horizontal di Pandas:
random_reviews['points'].value_counts().sort_index().plot.barh()
Anda dapat memplot data melalui jumlah kemunculan juga:
random_reviews.groupby(“negara”).price.mean().sort_values(ascending=False)[:5].plot.bar()
Bagan Garis
Anda harus menggunakan '<dataframe>.plot.line()' untuk membuat diagram garis di Pandas, Di Pandas, Anda tidak perlu mengulang setiap kolom yang Anda butuhkan untuk plot karena dapat melakukannya secara otomatis. Fitur ini tidak tersedia di Matplotlib. Berikut kodenya:
random.drop(['class'], axis=1).plot.line(title='Random Dataset')
Plot Pencar
Anda dapat membuat plot pencar di Pandas dengan menggunakan “<dataset>.plot.scatter()”. Anda harus memberikan dua argumen, yaitu, nama kolom-x dan kolom-y.
Ini dia contohnya:
random.plot.scatter(x='sepal_length', y='sepal_width', title="Set Data Acak')
Histogram
Gunakan 'plot.hist' untuk membuat Histogram di Pandas. Selain itu, tidak banyak dalam metode ini. Anda memiliki opsi untuk membuat satu Histogram atau beberapa Histogram.
Untuk membuat satu Histogram, gunakan kode berikut:
random_reviews['poin'].plot.hist()
Untuk membuat beberapa Histogram, gunakan ini:
random.plot.hist(subplots=True, layout=(2,2), figsize=(10, 10), bins=20)
Yg keturunan dr laut
Seaborn didasarkan pada Matplotlib dan juga merupakan pustaka Python yang cukup populer untuk visualisasi data. Ini memberi Anda antarmuka lanjutan untuk memplot data Anda. Ini memiliki banyak fitur. Kemampuannya yang canggih memungkinkan Anda membuat grafik hebat dengan baris kode yang jauh lebih sedikit daripada yang Anda perlukan dengan Matplotlib.
Histogram
Bagan Garis
Anda dapat menggunakan metode 'sns.line plot' untuk membuat diagram garis di Seaborn. Anda dapat menggunakan metode 'sns.kdeplot' untuk membulatkan tepi kurva garis. Itu membuat plot Anda cukup bersih jika memiliki banyak outlier.
sns.lineplot(data=random.drop(['class'], axis=1))
Plot Pencar
Di Seaborn, Anda dapat membuat plot pencar melalui metode '.scatterplot'. Anda harus menambahkan nama kolom x dan y dalam kasus ini, seperti yang kami lakukan dengan Pandas. Tapi ada perbedaan. Kami tidak dapat memanggil fungsi pada data seperti yang kami lakukan di Pandas, jadi kami harus meneruskannya sebagai argumen tambahan.
sns.scatterplot(x='sepal_length', y='sepal_width', data=iris)
Dengan menggunakan argumen 'hue', Anda juga dapat menyoroti poin-poin tertentu. Fitur ini tidak semudah ini di Matplotlib.
sns.scatterplot(x='sepal_length', y='sepal_width', hue='class', data=iris)
Grafik batang
Anda dapat menggunakan metode 'sns.countplot' untuk membuat diagram batang di Seaborn:
sns.countplot(random_reviews['poin'])
Sekarang kita telah membahas pustaka penting untuk visualisasi data dengan Python, kita dapat melihat bentuk grafik lainnya. Python dan pustakanya memungkinkan Anda membuat berbagai jenis gambar untuk memplot data Anda.
Jenis Visualisasi Data Lainnya dengan Python
Pie chart
Bagan pai menampilkan data di berbagai bagian lingkaran. Anda pasti pernah melihat banyak diagram lingkaran di sekolah. Diagram lingkaran mewakili data dalam persentase. Jumlah total semua segmen diagram lingkaran harus sama dengan 100%. Berikut adalah contoh kodenya:
plt.pie(df['Umur'], labels = {“A”, “B”, “C”,
“D”, “E”, “F”,
“G”, “H”, “Aku”, “J”},
autopct ='% 1.1f %%', shadow = True)
plt.tampilkan()
plt.pie(df['Penghasilan'], label = {“A”, “B”, “C”,
“D”, “E”, “F”,
“G”, “H”, “Aku”, “J”},
autopct ='% 1.1f %%', shadow = True)
plt.tampilkan()
plt.pie(df['Penjualan'], labels = {“A”, “B”, “C”,
“D”, “E”, “F”,
“G”, “H”, “Aku”, “J”},
autopct ='% 1.1f %%', shadow = True)
plt.tampilkan()
Plot Kotak
Plot kotak didasarkan pada data statistik minimum, kuartil pertama, median, kuartil ketiga, dan maksimum. Grafik terlihat seperti kotak (lebih spesifik, persegi panjang). Itu sebabnya ia memiliki nama 'petak kotak.' Berikut contoh kode untuk membuat grafik plot kotak:
# Untuk setiap atribut numerik dari bingkai data
df.plot.box()
# plot kotak atribut individu
plt.boxplot(df['Penghasilan'])
plt.tampilkan()
Baca juga: 10 Alat Python Teratas yang Harus Diketahui Setiap Pengembang Python
Kesimpulan
Kami harap Anda menemukan artikel ini bermanfaat. Ada banyak jenis grafik yang dapat Anda plot melalui Python dan berbagai pustakanya. Jika Anda belum pernah melakukan visualisasi data Python, Anda harus mulai dengan Matplotlib. Setelah menguasainya, Anda dapat beralih ke perpustakaan visualisasi data yang lebih kompleks dan canggih seperti Pandas dan Seaborn.
Jika Anda penasaran untuk belajar tentang python, ilmu data, lihat PG Diploma IIIT-B & upGrad dalam Ilmu Data yang dibuat untuk para profesional yang bekerja dan menawarkan 10+ studi kasus & proyek, lokakarya praktis, bimbingan dengan pakar industri, 1-on-1 dengan mentor industri, 400+ jam pembelajaran dan bantuan pekerjaan dengan perusahaan-perusahaan top.
Manakah pustaka Visualisasi Data terbaik dengan Python?
Visualisasi Data dianggap sebagai bagian yang sangat penting dari analisis data. Ini karena tidak ada cara yang lebih baik daripada memahami beberapa tren data dan informasi dalam format visual. Jika Anda menyajikan data perusahaan Anda dalam format tertulis, orang mungkin akan menganggapnya membosankan. Tapi, jika Anda menyajikan yang sama dalam format visual, orang pasti akan lebih memperhatikannya.
Untuk menyederhanakan proses visualisasi data, ada perpustakaan tertentu di Python untuk membantu Anda. Anda tidak dapat mengatakan salah satu tertentu untuk menjadi yang terbaik karena itu akan sepenuhnya tergantung pada persyaratan. Beberapa perpustakaan visualisasi data terbaik di Python adalah matplotlib, plotly, seaborn, GGplot, dan altair.
Yang merupakan salah satu perpustakaan plot terbaik di Python?
Ada banyak dari mereka untuk mempermudah pekerjaan Anda dalam hal visualisasi data dan merencanakan perpustakaan. Terlihat bahwa di antara semua perpustakaan yang tersedia, Matplotlib dianggap lebih baik oleh pengguna.
Matplotlib menempati lebih sedikit ruang dan juga memiliki waktu berjalan yang lebih baik. Selain itu, ia juga menyediakan API berorientasi objek yang memungkinkan pengguna untuk memplot grafik dalam aplikasi itu sendiri. Matplotlib juga mendukung banyak jenis output, selain itu juga gratis dan open-source.
Manakah pustaka visualisasi data default untuk ilmuwan data?
Jika Anda menyukai ilmu data, maka ada kemungkinan besar Anda sudah menggunakan perpustakaan Matplotlib. Terlihat bahwa pemula hingga profesional berpengalaman lebih suka menggunakan perpustakaan ini untuk membangun visualisasi data yang kompleks.
Alasan utama di balik pertimbangan besarnya adalah jumlah fleksibilitas yang diberikannya kepada pengguna sebagai perpustakaan plot 2D. Jika Anda memiliki latar belakang MATLAB, Anda akan dapat melihat bahwa antarmuka Pyplot dari Matplotlib cukup familiar bagi Anda. Jadi, Anda tidak perlu banyak waktu untuk memulai dengan visualisasi pertama Anda. Pengguna dapat mengontrol seluruh visualisasi di Matplotlib dari tingkat yang paling terperinci.