Le migliori librerie di visualizzazione dei dati Python che dovresti conoscere
Pubblicato: 2020-03-20Python può fare molte cose con i dati. E una delle sue numerose capacità è la visualizzazione. Ha più librerie che puoi usare per questo scopo. In questo articolo, daremo un'occhiata ad alcune delle sue importanti librerie e ai vari grafici che puoi tracciare attraverso di esse.
Sommario
Visualizzazione dati Python
Abbiamo condiviso più esempi in questo articolo, assicurati di provarli usando un set di dati. Iniziamo:
Librerie di visualizzazione dati Python
Python ha molte librerie per creare bellissimi grafici. Tutti hanno varie caratteristiche che ne migliorano le prestazioni e le capacità. E sono disponibili per tutti i livelli di abilità. Ciò significa che puoi eseguire la visualizzazione dei dati in Python, che tu sia un principiante o un programmatore avanzato. Di seguito sono elencate alcune importanti biblioteche:
- Nato dal mare
- Matplotlib
- Panda
Esistono molte altre librerie Python per la scienza dei dati , ma per il momento ci siamo concentrati su quelle importanti. Ora discuteremo queste diverse librerie e capiremo come tracciare grafici usando loro e Python. Iniziamo.
Matplotlib
La libreria Python più popolare per la stampa di grafici è Matplotlib. Non richiede molta esperienza e per i principianti è perfetto. Puoi iniziare ad apprendere la visualizzazione dei dati attraverso questa libreria e padroneggiare una varietà di grafici e visualizzazioni. Ti dà molta libertà, ma dovresti anche scrivere molto codice.
Le persone usano Matplotlib per visualizzazioni semplici come grafici a barre e istogrammi.
Leggi : Frame di dati in Python
Grafico a linee
Per creare un grafico a linee, dovresti usare il metodo 'plot'. Eseguendo il ciclo delle colonne, puoi creare più colonne nel tuo grafico. Utilizzare il codice seguente per questo scopo:
# ottieni colonne da tracciare
colonne = iris.columns.drop(['class'])
# crea x dati
x_data = intervallo(0, iris.shape[0])
# crea figura e asse
fig, ax = plt.subplots()
# traccia ogni colonna
per colonna in colonne:
ax.plot(x_data, iris[colonna], etichetta=colonna)
# imposta titolo e legenda
ax.set_title('Set di dati dell'iride')
ax.leggenda()
Trama a dispersione
Puoi creare un grafico a dispersione usando il metodo 'scatter'. Dovresti creare un asse e una figura tramite 'plt.subplots' per dare alla tua trama etichette e un titolo.
Usa il seguente codice:
# crea una figura e un asse
fig, ax = plt.subplots()
# scatter la sepal_length contro la sepal_width
ax.scatter(iris['sepal_length'], iris['sepal_width'])
# imposta un titolo e delle etichette
ax.set_title('Set di dati dell'iride')
ax.set_xlabel('sepal_length')
ax.set_ylabel('sepal_width')
Puoi aggiungere colore ai punti dati in base alle loro classi. A questo scopo, dovrai creare un dizionario che mapperebbe dalla classe al colore. Disperderebbe ogni punto anche usando un ciclo for.
# crea un dizionario dei colori
colori = {'Iris-setosa':'r', 'Iris-versicolor':'g', 'Iris-virginica':'b'}
# crea una figura e un asse
fig, ax = plt.subplots()
# traccia ogni punto dati
for i in range(len(iris['sepal_length'])):
ax.scatter(iris['sepal_length'][i], iris['sepal_width'][i],color=colors[iris['class'][i]])
# imposta un titolo e delle etichette
ax.set_title('Set di dati dell'iride')
ax.set_xlabel('sepal_length')
ax.set_ylabel('sepal_width')
Istogramma
Puoi usare il metodo 'hist' per creare un istogramma in Matplotlib. Può calcolare la frequenza con cui si verifica ogni classe se gli forniamo dati categoriali. Ecco il codice che dovresti usare per tracciare un istogramma in Matplotlib:
# crea figura e asse
fig, ax = plt.subplots()
# traccia l'istogramma
ax.hist(wine_reviews['punti'])
# imposta titolo ed etichette
ax.set_title('Punteggi recensione vino')
ax.set_xlabel('Punti')
ax.set_ylabel('Frequenza')
Grafico a barre
Matplotlib ha metodi semplici per tracciare grafici diversi. Ad esempio, in questo caso, per creare un grafico a barre in Matplotlib, dovrai usare "bar". Non può calcolare automaticamente la frequenza delle categorie, quindi dovrai utilizzare la funzione 'value_counts' per risolvere questo problema. Se i tuoi dati non hanno molti tipi, il grafico a barre sarebbe perfetto per la sua visualizzazione.
# crea una figura e un asse
fig, ax = plt.subplots()
# contare le occorrenze di ogni classe
data = wine_reviews['punti'].value_counts()
# ottieni i dati x e y
punti = data.index
frequenza = dati.valori
# crea un grafico a barre
ax.bar(punti, frequenza)
# imposta titolo ed etichette
ax.set_title('Punteggi recensione vino')
ax.set_xlabel('Punti')
ax.set_ylabel('Frequenza')
Panda
Pandas è una libreria Python popolare per l'analisi e la manipolazione dei dati. È una libreria open source quindi puoi usarla gratuitamente. È entrata nel mercato nel 2008 e da allora è diventata una delle librerie più popolari per la strutturazione dei dati.
Usando il data frame panda, puoi facilmente creare grafici per i tuoi dati. La sua API è più avanzata di Matplotlib. Ciò significa che puoi creare grafici con meno codice in Pandas rispetto a Matplotlib.
Grafico a barre
In Pandas, dovrai utilizzare il metodo 'plot.bar()' per tracciare un grafico a barre. Innanzitutto, dovrai contare le occorrenze nella tua trama tramite 'value_count()' e poi ordinarle con 'sort_index()'. Ecco un codice di esempio per creare un grafico a barre:
random_reviews['punti'].value_counts().sort_index().plot.bar()

Puoi utilizzare il metodo 'plot.barh()' per creare un grafico a barre orizzontale in Pandas:
random_reviews['punti'].value_counts().sort_index().plot.barh()
Puoi anche tracciare i dati attraverso il numero di occorrenze:
random_reviews.groupby(“country”).price.mean().sort_values(ascending=False)[:5].plot.bar()
Grafico a linee
Dovrai usare '<dataframe>.plot.line()' per creare un grafico a linee in Pandas, In Pandas, non avresti bisogno di scorrere tutte le colonne che devi tracciare in quanto può farlo automaticamente. Questa funzione non è disponibile in Matplotlib. Ecco il codice:
random.drop(['class'], axis=1).plot.line(title='Random Dataset')
Trama a dispersione
Puoi creare un grafico a dispersione in Pandas usando "<dataset>.plot.scatter()". Dovresti passargli due argomenti, che sono i nomi della colonna x e della colonna y.
Ecco il suo esempio:
random.plot.scatter(x='sepal_length', y='sepal_width', title=”Random Dataset')
Istogramma
Usa 'plot.hist' per creare un istogramma in Pandas. A parte questo, non c'è molto in questo metodo. Hai la possibilità di creare un singolo istogramma o più istogrammi.
Per creare un istogramma, utilizzare il codice seguente:
random_reviews['punti'].plot.hist()
Per creare più istogrammi, utilizzare questo:
random.plot.hist(subplots=True, layout=(2,2), figsize=(10, 10), bins=20)
Nato dal mare
Seaborn è basato su Matplotlib ed è anche una libreria Python abbastanza popolare per la visualizzazione dei dati. Ti offre interfacce avanzate per tracciare i tuoi dati. Ha molte caratteristiche. Le sue capacità avanzate ti consentono di creare fantastici grafici con molte meno righe di codice di quelle necessarie con Matplotlib.
Istogramma
Grafico a linee
Puoi usare il metodo 'sns.line plot' per creare un grafico a linee in Seaborn. Puoi usare il metodo 'sns.kdeplot' per arrotondare i bordi delle curve delle linee. Mantiene la tua trama abbastanza pulita se ha molti valori anomali.
sns.lineplot(data=random.drop(['class'], axis=1))
Trama a dispersione
In Seaborn, puoi creare un grafico a dispersione tramite il metodo '.scatterplot'. In questo caso dovrai aggiungere i nomi delle colonne xey, proprio come abbiamo fatto con Pandas. Ma c'è una differenza. Non possiamo chiamare la funzione sui dati come abbiamo fatto in Pandas, quindi dovremo passarla come argomento aggiuntivo.
sns.scatterplot(x='sepal_length', y='sepal_width', data=iris)
Usando l'argomento "tonalità", puoi anche evidenziare punti specifici. Questa funzione non è così facile in Matplotlib.
sns.scatterplot(x='sepal_length', y='sepal_width', hue='classe', data=iris)
Grafico a barre
Puoi utilizzare il metodo 'sns.countplot' per creare un grafico a barre in Seaborn:
sns.countplot(random_reviews['punti'])
Ora che abbiamo discusso delle librerie critiche per la visualizzazione dei dati in Python, possiamo dare un'occhiata ad altre forme di grafici. Python e le sue librerie ti consentono di creare vari tipi di figure per tracciare i tuoi dati.
Altri tipi di visualizzazione dei dati in Python
Grafico a torta
I grafici a torta mostrano i dati in diverse sezioni di un cerchio. Devi aver visto un sacco di grafici a torta a scuola. I grafici a torta rappresentano i dati in percentuale. La somma totale di tutti i segmenti di un grafico a torta dovrebbe essere uguale al 100%. Ecco il codice di esempio:
plt.pie(df['Età'], etichette = {“A”, “B”, “C”,
“D”, “E”, “F”,
“G”, “H”, “I”, “J”},
autopct ='% 1.1f %%', shadow = True)
plt.show()
plt.pie(df['Reddito'], etichette = {"A", "B", "C",
“D”, “E”, “F”,
“G”, “H”, “I”, “J”},
autopct ='% 1.1f %%', shadow = True)
plt.show()
plt.pie(df['Vendite'], etichette = {“A”, “B”, “C”,
“D”, “E”, “F”,
“G”, “H”, “I”, “J”},
autopct ='% 1.1f %%', shadow = True)
plt.show()
Box plot
I box plot si basano sul minimo, primo quartile, mediana, terzo quartile e massimo dei dati statistici. Il grafico si presenta come una scatola (più precisamente, un rettangolo). Ecco perché ha il nome "box plot". Ecco un esempio di codice per la creazione di un grafico box plot:
# Per ogni attributo numerico del frame di dati
df.plot.box()
# box plot attributo individuale
plt.boxplot(df['Reddito'])
plt.show()
Leggi anche: I 10 migliori strumenti Python che ogni sviluppatore Python dovrebbe conoscere
Conclusione
Ci auguriamo che tu abbia trovato utile questo articolo. Esistono molti tipi di grafici che puoi tracciare tramite Python e le sue varie librerie. Se non hai mai eseguito la visualizzazione dei dati Python prima, dovresti iniziare con Matplotlib. Dopo averlo padroneggiato, puoi passare a librerie di visualizzazione dei dati più complesse e avanzate come Pandas e Seaborn.
Se sei curioso di conoscere Python, la scienza dei dati, dai un'occhiata al Diploma PG in Data Science di IIIT-B e upGrad, creato per i professionisti che lavorano e offre oltre 10 casi di studio e progetti, workshop pratici pratici, tutoraggio con esperti del settore, 1 contro 1 con mentori del settore, oltre 400 ore di apprendimento e assistenza al lavoro con le migliori aziende.
Quali sono le migliori librerie di visualizzazione dei dati in Python?
La visualizzazione dei dati è considerata una parte estremamente importante dell'analisi dei dati. Questo perché non c'è modo migliore che comprendere diverse tendenze e informazioni dei dati in un formato visivo. Se presenti i dati della tua azienda in un formato scritto, le persone potrebbero trovarlo noioso. Ma se presenti lo stesso in un formato visivo, le persone presteranno sicuramente maggiore attenzione ad esso.
Per semplificare il processo di visualizzazione dei dati, ci sono alcune librerie in Python per aiutarti. Non puoi dire che uno in particolare sia il migliore perché dipenderà completamente dai requisiti. Alcune delle migliori librerie di visualizzazione dei dati in Python sono matplotlib, plotly, seaborn, GGplot e altair.
Qual è una delle migliori librerie di plottaggio in Python?
Ce ne sono molti per semplificarti il lavoro quando si tratta di visualizzazione dei dati e librerie di stampa. È stato visto che tra tutte le librerie disponibili, Matplotlib è considerata una migliore dagli utenti.
Matplotlib occupa meno spazio e ha anche un tempo di esecuzione migliore. Oltre a ciò, fornisce anche un'API orientata agli oggetti che consente agli utenti di tracciare grafici nell'applicazione stessa. Matplotlib supporta anche molti tipi di output, oltre ad essere gratuito e open source.
Qual è la libreria di visualizzazione dei dati predefinita per i data scientist?
Se ti piace la scienza dei dati, ci sono alte probabilità che tu abbia già utilizzato la libreria Matplotlib. È stato visto che i principianti ei professionisti esperti preferiscono utilizzare questa libreria per creare visualizzazioni di dati complessi.
Il motivo principale alla base della sua enorme considerazione è la quantità di flessibilità che offre agli utenti come libreria di plottaggio 2D. Se hai un background MATLAB, sarai in grado di notare che l'interfaccia Pyplot di Matplotlib ti è abbastanza familiare. Quindi, non avrai bisogno di molto tempo per iniziare con la tua prima visualizzazione. L'utente può controllare l'intera visualizzazione in Matplotlib dal livello più granulare.