Pandas Dataframe Astype: Sintaxe, Tipos de Dados, Criando Dataframe

Publicados: 2020-08-28

Python é uma das linguagens mais usadas em vários setores para fins de manipulação e análise de dados. A maior razão por trás da popularidade do Python é seu vasto conjunto de bibliotecas que simplifica para os desenvolvedores manter e monitorar dados. Uma dessas bibliotecas escritas para Python é Pandas . A biblioteca Pandas , em particular, é usada para manipular séries temporais e tabelas. Confira nossos cursos de ciência de dados para saber mais sobre pandas.

O Pandas DataFrame. o método astype () ou às vezes também chamado de astype () é usado para converter objetos pandas em um dtype. função astype (). É particularmente muito útil quando precisamos converter o tipo de dados de uma ou várias colunas de uma tabela para outra.

Índice

Sintaxe de Pandas DataFrame.astype()

Primeiramente, antes de discutir a sintaxe, precisamos importar a biblioteca Pandas, o que é feito por:

importar pandas como pd

A sintaxe para DataFrame. o método astype () é:

DataFrame.astype(dtype, copy=True, errors='raise', **kwargs)

Parâmetros

Descrição

Valor padrão

dtype

Usa numpy.dtype ou o tipo Python para converter o objeto inteiro no mesmo tipo. Alternativamente, ele também pode usar {col: dtype, ?} onde col é o rótulo da coluna e dtype funcionará da mesma forma para converter uma ou mais colunas do DataFrame em tipos específicos de coluna.

dtype

cópia de

Retorna uma cópia ao definir como True (configurar copy=false pode propagar alterações nos valores para outros objetos pandas ).

Verdadeiro

erros

Controla a geração de exceções em dados inválidos para o dtype fornecido.

levantar

kwargs

Argumentos de palavra-chave para passar para o construtor.

Returns : casted: retorno semelhante ao tipo de chamador.

Leia: Data Frames em Python

Tipos de dados na biblioteca Pandas

Agora, desde o Pandas DataFrame. astype () é sobre converter e alterar tipos de dados em tabelas, vamos ver os tipos de dados e seu uso na biblioteca Pandas .

1. Objeto : Usado para texto ou valores alfanuméricos.

2. Int64 : Usado para números inteiros.

3. Float64 : Usado para números de ponto flutuante.

4. Bool : Usado para valores Verdadeiro/Falso.

5. Datetime64 : Usado para valores de data e hora.

6. Timedelta[ns] : Usado para diferenças entre dois datetimes.

7. Categoria : Usado para uma lista de valores de texto.

Criando um DataFrame na biblioteca Pandas

Existem duas maneiras de criar um quadro de dados em um objeto pandas . Podemos criar uma tabela ou inserir um arquivo CSV existente. O código para inserir um arquivo existente é:

df = pd.read_csv(“ file_name.csv ”)

A sintaxe para criar uma nova tabela para o data frame é:

t = {'coluna 1': [1, 2], 'coluna 2': [3, 4]}

df = pd.DataFrame(data=t)

Deve ler: Tutorial do Python Panda para iniciantes

Usando o método Pandas Dataframe.astype()

Depois de inserir a tabela e o dataframe no objeto pandas , podemos começar a converter os tipos de dados de uma ou mais colunas da tabela. Podemos verificar os tipos de dados dos valores antes de convertê-los usando o código df.dtypes ou df.info() . Ambos os códigos exibirão os tipos de dados de cada coluna da tabela.

Outra coisa a notar é que o DataFrame. o método astype () pode dar um erro se o quadro de dados tiver valores nan ou NA. Portanto, antes de prosseguir, precisamos limpar todos os valores nan da tabela. A sintaxe para descartar valores nan ou NA é:

df.dropna(inplace = True)

Convertendo todas as colunas de um dataframe

Sintaxe: df. astype (' data_type ').dtypes

Todo o tipo de dados do dataframe será convertido para o valor que colocamos em ' data_type. '

Convertendo colunas específicas de um dataframe

Sintaxe: df. astype ({“ col_name ”: ' data_type '}).dtypes

“col_name” aqui requer um nome de coluna como entrada. Qualquer que seja o nome da coluna que colocarmos, o tipo de dados dessa coluna será alterado para o valor que fornecemos em ' data_type.'

Convertendo várias colunas de uma vez

Sintaxe: df. astype ({“ col_name ”: 'data_type', “ col_name ”: ' data_type ', “ col_name ”: ' data_type '}).dtypes

Tudo o que fizemos aqui foi separar todas as colunas que queremos converter com uma vírgula. O “ col_name ” e ' data_type ' na sintaxe requerem os mesmos valores necessários ao converter uma única coluna.

Resumindo

É assim que o Pandas DataFrame. o método astype () é usado. Atualmente, o Python é uma das linguagens de programação mais preferidas, pois também colocou um pé no aprendizado de máquina e na ciência de dados. Se você quer saber como o Python está sendo usado nesses dois campos, e como ele pode ajudar na sua carreira em Data Science , você pode ler tudo sobre isso em nosso blog. Você pode visitar o site da Upgrad para obter um Programa PG Executivo em Ciência de Dados ou certificação PG em Machine Learning e Deep

Quão difícil é aprender Pandas?

Pandas é um pacote Python, portanto, você precisará estar familiarizado com o básico da sintaxe Python antes de começar a usá-lo. A sintaxe básica dos pandas pode parecer estranha no começo, mas com a prática, você pode aprender coisas como agrupar, aplicar funções a qualquer eixo, girar. A natureza multifuncional do Python foi expandida pela criação da biblioteca Pandas para lidar também com problemas de aprendizado de máquina.

Como posso instalar a versão mais recente do Pandas no PC?

Baixe e instale a versão mais recente do pip

2. Baixe a versão mais recente do Python. Para evitar dificuldades com a instalação do Python, clique na opção para desativar o comprimento do caminho assim que terminar de instalar o Python.

3. Agora que o Python está instalado, você deve ir ao prompt de comando e instalar o Pandas a partir daí. Então, vá para a caixa de pesquisa da sua área de trabalho e digite 'cmd' nela. Um programa chamado Prompt de Comando deve aparecer. Para começar, basta clicar no botão.

4. Agora, dê o comando 'pip install manager' no prompt de comando. Aguarde a conclusão do download e você poderá executar o Pandas de dentro do seu aplicativo Python.

Quais são as limitações de usar Pandas em Python?

Algumas das sintaxes do Pandas podem ser complicadas ao usar seus níveis avançados. Isso é um problema, pois muitos usuários não conseguem alternar entre o código Python padrão e o Pandas de maneira eficiente e suave.

2. À medida que você progride e aprende mais sobre o framework Pandas, você pode achar alguns conceitos um pouco difíceis de entender.

3. Pandas será de pouca utilidade uma vez que seus dados tenham sido atualizados para uma matriz tridimensional (3D), e você precisará contar com outras bibliotecas como NumPy para assistência, pois o Pandas tem pouca compatibilidade com matriz 3D.