Pandas Dataframe Astype:语法、数据类型、创建数据框

已发表: 2020-08-28

Python 是各个行业中用于数据操作和分析目的的最常用语言之一。 Python 受欢迎的最大原因是其庞大的库集,使开发人员可以轻松地维护和监控数据。 为 Python 编写的此类库之一是Pandas Pandas尤其用于处理时间序列和表格。 查看我们的数据科学课程,了解有关熊猫的更多信息。

熊猫数据框 astype () 或有时也称为astype () 方法用于将pandas对象转换为 dtype。 astype () 函数。 当我们需要将表的一个或多个列的数据类型转换为另一种时,它特别有用。

目录

Pandas DataFrame.astype() 的语法

首先,在讨论语法之前,我们需要导入 Pandas 库,通过以下方式完成:

将熊猫导入为 pd

DataFrame 的语法。 astype () 方法是:

DataFrame.astype(dtype, copy=True, errors='raise', **kwargs)

参数

描述

默认值

类型

使用 numpy.dtype 或 Python 类型将整个对象转换为相同的类型。 它也可以使用 {col: dtype, ?} 其中 col 是列标签,并且 dtype 将起到相同的作用,将 DataFrame 的一个或多个列转换为特定于列的类型。

类型

复制

设置为 True 时返回一个副本(设置 copy=false 可以将值的更改传播到其他pandas对象)。

真的

错误

控制针对给定 dtype 的无效数据引发的异常。

增加

夸格斯

要传递给构造函数的关键字参数。

返回: casted:返回类似于调用者的类型。

阅读:Python 中的数据框

Pandas 库中的数据类型

现在从Pandas DataFrame 开始。 astype () 方法是关于转换和更改表中的数据类型,让我们看看数据类型及其在Pandas库中的用法。

1. 对象:用于文本或字母数字值。

2. Int64 :用于整数。

3.浮点64 用于浮点数。

4. Bool :用于真/假值。

5. Datetime64 :用于日期和时间值。

6. Timedelta[ns] :用于两个日期时间之间的差异。

7. 类别:用于文本值列表。

在 Pandas 库中创建 DataFrame

pandas对象中创建数据框有两种方法我们可以创建一个表或插入一个现有的 CSV 文件。 插入现有文件的代码是:

df = pd.read_csv(“ file_name.csv ”)

为数据框创建新表的语法是:

t = {'col 1': [1, 2], 'col 2': [3, 4]}

df = pd.DataFrame(数据=t)

必读:Python Panda 初学者教程

使用 Pandas Dataframe.astype() 方法

一旦我们将表和数据框插入到pandas对象中,我们就可以开始转换表中一列或多列的数据类型。 我们可以使用代码df.dtypesdf.info()在转换它们之前检查值的数据类型 这两个代码都将显示表格每一列的数据类型。

另一件需要注意的是 DataFrame. 如果数据框具有 nan 或 NA 值, astype () 方法可能会出错。 所以在继续之前,我们需要从表中清除所有的 nan 值。 删除 nan 或 NA 值的语法是:

df.dropna(就地=真)

转换数据框的所有列

语法:df。 astype (' data_type ').dtypes

整个数据框的数据类型将转换为我们放入' data_type. '

转换数据框的特定列

语法:df。 astype ({“ col_name ”: ' data_type '}).dtypes

这里的“col_name”需要一个列名作为输入。 无论我们输入什么列名,该列的数据类型都将更改为我们在“ data_type”中提供的值。

一次转换多列

语法:df。 astype ({“ col_name ”: 'data_type', “ col_name ”: ' data_type ', “ col_name ”: ' data_type '}).dtypes

我们在这里所做的只是用逗号分隔要转换的所有列。 语法中的“ col_name ”和“ data_type ”需要与转换单个列时​​所需的值相同的值。

总结一下

这就是Pandas DataFrame方式。 使用astype () 方法。 Python 是目前最受欢迎的编程语言之一,因为它还涉足机器学习和数据科学。 如果您想了解 Python 在这两个领域中的使用情况,以及它如何帮助您在数据科学领域的职业生涯,您可以在我们的博客中阅读所有相关信息。 您可以访问Upgrad 的网站以获得数据科学的执行 PG 计划机器学习和深度的 PG 认证

学熊猫有多难?

Pandas 是一个 Python 包,因此在开始使用它之前,您需要熟悉 Python 语法的基础知识。 基本的 pandas 语法起初可能看起来很奇怪,但通过练习,您可以学习分组、将函数应用于任何轴、旋转等内容。 通过创建 Pandas 库来解决机器学习问题,Python 的多用途特性得到了扩展。

如何在 PC 上安装最新版本的 Pandas?

下载并安装最新版本的 pip

2.下载最新版本的Python。 为避免 Python 安装出现任何困难,请在完成 Python 安装后单击选项以停用路径长度。

3. 现在 Python 已安装,您应该转到命令提示符并从那里安装 Pandas。 因此,请转到桌面的搜索框并在其中输入“cmd”。 应该会出现一个名为命令提示符的程序。 首先,只需单击按钮。

4. 现在,在命令提示符下输入命令“pip install manager”。 等待下载完成,然后您就可以在 Python 应用程序中运行 Pandas。

在 Python 中使用 Pandas 有什么限制?

使用高级级别时,Pandas 的某些语法可能会很复杂。 这是一个问题,因为许多用户无法以高效和流畅的方式在标准 Python 代码和 Pandas 之间移动。

2. 随着您对 Pandas 框架的了解和深入,您可能会发现一些概念有点难以理解。

3. 一旦你的数据升级为三维 (3D) 矩阵,Pandas 就没什么用了,你需要依赖 NumPy 等其他库来提供帮助,因为 Pandas 对 3D 矩阵的兼容性很差。