Pandas Dataframe Astype: sintassi, tipi di dati, creazione di frame di dati

Pubblicato: 2020-08-28

Python è uno dei linguaggi più utilizzati in vari settori per scopi di manipolazione e analisi dei dati. Il motivo principale alla base della popolarità di Python è il suo vasto insieme di librerie che semplificano la manutenzione e il monitoraggio dei dati da parte degli sviluppatori. Una di queste librerie scritte per Python è Pandas . La libreria Pandas , in particolare, viene utilizzata per manipolare serie temporali e tabelle. Dai un'occhiata ai nostri corsi di scienza dei dati per saperne di più sui panda.

Il DataFrame Panda . astype () o talvolta indicato anche come astype () metodo viene utilizzato per eseguire il cast di oggetti panda in un dtype. astype () funzione. È particolarmente utile quando è necessario convertire il tipo di dati di una o più colonne di una tabella in un'altra.

Sommario

Sintassi di Pandas DataFrame.astype()

Innanzitutto, prima di discutere la sintassi, dobbiamo importare la libreria Pandas, che viene eseguita da:

importa panda come pd

La sintassi per DataFrame. il metodo astype () è:

DataFrame.astype(dtype, copy=True, errors='raise', **kwargs)

Parametri

Descrizione

Valore predefinito

tipo d

Usa numpy.dtype o il tipo Python per eseguire il cast dell'intero oggetto sullo stesso tipo. In alternativa può anche utilizzare {col: dtype, ?} dove col è l'etichetta della colonna e dtype funzionerà allo stesso modo per trasmettere una o più colonne di DataFrame a tipi specifici di colonna.

tipo d

copia

Restituisce una copia quando l'impostazione su True (l'impostazione di copy=false può propagare le modifiche ai valori ad altri oggetti panda ).

Vero

errori

Controlla le eccezioni che generano dati non validi per il dtype specificato.

aumentare

kwarg

Argomenti delle parole chiave da trasmettere al costruttore.

Restituisce : casted: restituisce simile al tipo di chiamante.

Leggi: Frame di dati in Python

Tipi di dati nella libreria Pandas

Ora da Pandas DataFrame. Il metodo astype () riguarda il cast e la modifica dei tipi di dati nelle tabelle, esaminiamo i tipi di dati e il loro utilizzo nella libreria Pandas .

1. Oggetto : utilizzato per testo o valori alfanumerici.

2. Int64 : Usato per i numeri interi.

3. Float64 : Usato per i numeri in virgola mobile.

4. Bool : Usato per i valori Vero/Falso.

5. Datetime64 : utilizzato per i valori di data e ora.

6. Timedelta[ns] : Usato per differenze tra due datetime.

7. Categoria : Usato per un elenco di valori di testo.

Creazione di un DataFrame nella libreria Pandas

Esistono due modi per creare un frame di dati in un oggetto panda . Possiamo creare una tabella o inserire un file CSV esistente. Il codice per inserire un file esistente è:

df = pd.read_csv(“ nome_file.csv ”)

La sintassi per creare una nuova tabella per il frame di dati è:

t = {'col 1': [1, 2], 'col 2': [3, 4]}

df = pd.DataFrame(data=t)

Da leggere: Tutorial Python Panda per principianti

Utilizzo del metodo Pandas Dataframe.astype()

Dopo aver inserito la tabella e il dataframe nell'oggetto panda , possiamo iniziare a convertire i tipi di dati di una o più colonne della tabella. Possiamo controllare i tipi di dati dei valori prima di convertirli utilizzando il codice df.dtypes o df.info() . Entrambi questi codici visualizzeranno i tipi di dati di ciascuna colonna della tabella.

Un'altra cosa da notare è che il DataFrame. il metodo astype () può dare un errore se il frame di dati ha valori nan o NA. Quindi, prima di procedere, dobbiamo cancellare tutti i valori nan dalla tabella. La sintassi per eliminare i valori nan o NA è:

df.dropna(inplace = True)

Conversione di tutte le colonne di un dataframe

Sintassi: df. astype (' tipo_dati ').dtypes

L'intero tipo di dati del frame di dati verrà convertito nel valore inserito in ' data_type. '

Conversione di colonne specifiche di un dataframe

Sintassi: df. astype ({“ col_name ”: ' data_type '}).dtypes

"col_name" qui richiede un nome di colonna come input. Qualunque sia il nome della colonna che abbiamo inserito, il tipo di dati di quella colonna verrà modificato nel valore fornito in ' tipo_dati.'

Conversione di più colonne alla volta

Sintassi: df. astype ({“ col_name ”: 'data_type', “ col_name ”: ' data_type ', “ col_name ”: ' data_type '}).dtypes

Tutto ciò che abbiamo fatto qui è stato separare tutte le colonne che vogliamo convertire con una virgola. I " col_name " e " data_type " nella sintassi richiedono gli stessi valori richiesti durante la conversione di una singola colonna.

Riassumendolo

Ecco come Pandas DataFrame . viene utilizzato il metodo astype (). Python è attualmente uno dei linguaggi di programmazione preferiti in quanto ha anche messo piede in Machine Learning e Data Science. Se vuoi sapere come viene utilizzato Python in questi due campi e come può aiutare la tua carriera nella scienza dei dati , puoi leggere tutto nel nostro blog. Puoi visitare il sito Web di Upgrad per ottenere un programma Executive PG in Data Science o una certificazione PG in Machine Learning e Deep

Quanto è difficile imparare i Panda?

Pandas è un pacchetto Python, quindi dovrai avere familiarità con le basi della sintassi di Python prima di iniziare a usarlo. La sintassi di base dei panda potrebbe sembrare strana all'inizio, ma con la pratica puoi imparare cose come raggruppare, applicare funzioni a qualsiasi asse, ruotare. La natura multiuso di Python è stata ampliata dalla creazione della libreria Pandas per affrontare anche i problemi di apprendimento automatico.

Come posso installare l'ultima versione di Pandas su PC?

Scarica e installa l'ultima versione di pip

2. Scarica l'ultima versione di Python. Per evitare qualsiasi difficoltà con l'installazione di Python, fare clic sull'opzione per disattivare la lunghezza del percorso una volta terminata l'installazione di Python.

3. Ora che Python è installato, dovresti andare al prompt dei comandi e installare Pandas da lì. Quindi, vai alla casella di ricerca del tuo desktop e digita "cmd" al suo interno. Dovrebbe apparire un programma chiamato Prompt dei comandi. Per iniziare, fai semplicemente clic sul pulsante.

4. Ora dai il comando 'pip install manager' al prompt dei comandi. Attendi il completamento del download, quindi sarai in grado di eseguire Pandas dall'interno della tua applicazione Python.

Quali sono i limiti dell'utilizzo di Panda in Python?

Alcune delle sintassi di Panda possono essere complicate quando si utilizzano i suoi livelli avanzati. Questo è un problema poiché molti utenti non sono in grado di spostarsi tra il codice Python standard e Panda in modo efficiente e regolare.

2. Man mano che avanzi e impari di più sul framework Pandas, potresti trovare alcuni concetti un po' difficili da capire.

3. Pandas sarà di scarsa utilità una volta che i tuoi dati sono stati aggiornati a una matrice tridimensionale (3D) e dovrai fare affidamento su altre librerie come NumPy per assistenza, poiché Pandas ha una scarsa compatibilità con la matrice 3D.