Pandas Dataframe Astype:語法、數據類型、創建數據框

已發表: 2020-08-28

Python 是各個行業中用於數據操作和分析目的的最常用語言之一。 Python 受歡迎的最大原因是其龐大的庫集,使開發人員可以輕鬆地維護和監控數據。 為 Python 編寫的此類庫之一是Pandas Pandas尤其用於處理時間序列和表格。 查看我們的數據科學課程,了解有關熊貓的更多信息。

熊貓數據框 astype () 或有時也稱為astype () 方法用於將pandas對象轉換為 dtype。 astype () 函數。 當我們需要將表的一個或多個列的數據類型轉換為另一種時,它特別有用。

目錄

Pandas DataFrame.astype() 的語法

首先,在討論語法之前,我們需要導入 Pandas 庫,通過以下方式完成:

將熊貓導入為 pd

DataFrame 的語法。 astype () 方法是:

DataFrame.astype(dtype, copy=True, errors='raise', **kwargs)

參數

描述

默認值

類型

使用 numpy.dtype 或 Python 類型將整個對象轉換為相同的類型。 它也可以使用 {col: dtype, ?} 其中 col 是列標籤,並且 dtype 將起到相同的作用,將 DataFrame 的一個或多個列轉換為特定於列的類型。

類型

複製

設置為 True 時返回一個副本(設置 copy=false 可以將值的更改傳播到其他pandas對象)。

真的

錯誤

控製針對給定 dtype 的無效數據引發的異常。

增加

誇格斯

要傳遞給構造函數的關鍵字參數。

返回: casted:返回類似於調用者的類型。

閱讀:Python 中的數據框

Pandas 庫中的數據類型

現在從Pandas DataFrame 開始。 astype () 方法是關於轉換和更改表中的數據類型,讓我們看看數據類型及其在Pandas庫中的用法。

1. 對象:用於文本或字母數字值。

2. Int64 :用於整數。

3.浮點64 用於浮點數。

4. Bool :用於真/假值。

5. Datetime64 :用於日期和時間值。

6. Timedelta[ns] :用於兩個日期時間之間的差異。

7. 類別:用於文本值列表。

在 Pandas 庫中創建 DataFrame

pandas對像中創建數據框有兩種方法 我們可以創建一個表或插入一個現有的 CSV 文件。 插入現有文件的代碼是:

df = pd.read_csv(“ file_name.csv ”)

為數據框創建新表的語法是:

t = {'col 1': [1, 2], 'col 2': [3, 4]}

df = pd.DataFrame(數據=t)

必讀:Python Panda 初學者教程

使用 Pandas Dataframe.astype() 方法

一旦我們將表和數據框插入到pandas像中,我們就可以開始轉換錶中一列或多列的數據類型。 我們可以使用代碼df.dtypesdf.info()在轉換它們之前檢查值的數據類型 這兩個代碼都將顯示表格每一列的數據類型。

另一件需要注意的是 DataFrame. 如果數據框具有 nan 或 NA 值, astype () 方法可能會出錯。 所以在繼續之前,我們需要從表中清除所有的 nan 值。 刪除 nan 或 NA 值的語法是:

df.dropna(就地=真)

轉換數據框的所有列

語法:df。 astype (' data_type ').dtypes

整個數據框的數據類型將轉換為我們放入' data_type. '

轉換數據框的特定列

語法:df。 astype ({“ col_name ”: ' data_type '}).dtypes

這裡的“col_name”需要一個列名作為輸入。 無論我們輸入什麼列名,該列的數據類型都將更改為我們在“ data_type”中提供的值。

一次轉換多列

語法:df。 astype ({“ col_name ”: 'data_type', “ col_name ”: ' data_type ', “ col_name ”: ' data_type '}).dtypes

我們在這裡所做的只是用逗號分隔要轉換的所有列。 語法中的“ col_name ”和“ data_type ”需要與轉換單個列時所需的值相同的值。

總結一下

這就是Pandas DataFrame方式。 使用astype () 方法。 Python 是目前最受歡迎的編程語言之一,因為它還涉足機器學習和數據科學。 如果您想了解 Python 在這兩個領域中的使用情況,以及它如何幫助您在數據科學領域的職業生涯,您可以在我們的博客中閱讀所有相關信息。 您可以訪問Upgrad 的網站以獲得數據科學的執行 PG 計劃機器學習和深度的 PG 認證

學熊貓有多難?

Pandas 是一個 Python 包,因此在開始使用它之前,您需要熟悉 Python 語法的基礎知識。 基本的 pandas 語法起初可能看起來很奇怪,但通過練習,您可以學習分組、將函數應用於任何軸、旋轉等內容。 通過創建 Pandas 庫來解決機器學習問題,Python 的多用途特性得到了擴展。

如何在 PC 上安裝最新版本的 Pandas?

下載並安裝最新版本的 pip

2.下載最新版本的Python。 為避免 Python 安裝出現任何困難,請在完成 Python 安裝後單擊選項以停用路徑長度。

3. 現在 Python 已安裝,您應該轉到命令提示符並從那里安裝 Pandas。 因此,請轉到桌面的搜索框並在其中輸入“cmd”。 應該會出現一個名為命令提示符的程序。 首先,只需單擊按鈕。

4. 現在,在命令提示符下輸入命令“pip install manager”。 等待下載完成,然後您就可以在 Python 應用程序中運行 Pandas。

在 Python 中使用 Pandas 有什麼限制?

使用高級級別時,Pandas 的某些語法可能會很複雜。 這是一個問題,因為許多用戶無法以高效和流暢的方式在標準 Python 代碼和 Pandas 之間移動。

2. 隨著您對 Pandas 框架的了解和深入,您可能會發現一些概念有點難以理解。

3. 一旦你的數據升級為三維 (3D) 矩陣,Pandas 就沒什麼用了,你需要依賴 NumPy 等其他庫來提供幫助,因為 Pandas 對 3D 矩陣的兼容性很差。