Pandas Dataframe Astype:構文、データ型、データフレームの作成

公開: 2020-08-28

Pythonは、データ操作と分析の目的でさまざまな業界で最も使用されている言語の1つです。 Pythonの人気の背後にある最大の理由は、開発者がデータを簡単に維持および監視できるようにするライブラリの膨大なセットです。 Python用に作成されたそのようなライブラリの1つは、 Pandasです。 特にPandasライブラリは、時系列とテーブルを操作するために使用されます。 パンダの詳細については、データサイエンスコースをご覧ください。

パンダDataFrame astype ()またはastype ()メソッドとも呼ばれるメソッドは、パンダオブジェクトをdtypeにキャストするために使用されます。 astype ()関数。 これは、テーブルの1つまたは複数の列のデータ型を別の列に変換する必要がある場合に特に便利です。

目次

パンダの構文DataFrame.astype()

まず、構文について説明する前に、Pandasライブラリをインポートする必要があります。これは次の方法で実行されます。

パンダをpdとしてインポートします

DataFrameの構文。 astype ()メソッドは次のとおりです。

DataFrame.astype(dtype、copy = True、errors ='raise'、** kwargs)

パラメーター

説明

デフォルト値

dtype

numpy.dtypeまたはPythonタイプを使用して、オブジェクト全体を同じタイプにキャストします。 または、{col:dtype、?}を使用することもできます。ここで、colは列ラベルであり、dtypeは同じように機能して、1つ以上のDataFrameの列を列固有の型にキャストします。

dtype

コピー

Trueに設定するとコピーを返します(copy = falseに設定すると、値の変更を他のpandasオブジェクトに伝播できます)。

エラー

指定されたdtypeの無効なデータで発生する例外を制御します。

高める

kwargs

コンストラクターに渡すキーワード引数。

戻り値:キャスト:呼び出し元のタイプと同様の戻り値。

読む:Pythonのデータフレーム

Pandasライブラリのデータ型

PandasDataFrame以降 astype ()メソッドは、テーブル内のデータ型のキャストと変更に関するものです。Pandasライブラリでのデータ型とその使用法を見てみましょう

1.オブジェクト:テキストまたは英数字の値に使用されます。

2. Int64 :整数に使用されます。

3. Float64 浮動小数点数に使用されます。

4. Bool :True/False値に使用されます。

5. Datetime64 :日付と時刻の値に使用されます。

6. Timedelta [ns] :2つの日時の違いに使用されます。

7.カテゴリ:テキスト値のリストに使用されます。

PandasライブラリでのDataFrameの作成

pandasオブジェクトにデータフレームを作成する方法は2つあります。 テーブルを作成するか、既存のCSVファイルを挿入することができます。 既存のファイルを挿入するコードは次のとおりです。

df = pd.read_csv(“ file_name.csv ”)

データフレームの新しいテーブルを作成するための構文は次のとおりです。

t = {'col 1':[1、2]、'col 2':[3、4]}

df = pd.DataFrame(data = t)

必読:初心者のためのPythonパンダチュートリアル

Pandas Dataframe.astype()メソッドの使用

テーブルとデータフレームをpandasオブジェクトに挿入したら、テーブルの1つ以上の列のデータ型の変換を開始できます。 コードdf.dtypesまたはdf.info()を使用して、値を変換する前に値のデータ型を確認できます これらのコードは両方とも、テーブルの各列のデータ型を表示します。

注意すべきもう1つのことは、DataFrameです。 astype ()メソッドは、データフレームにnanまたはNA値がある場合にエラーを発生させる可能性があります。 したがって、先に進む前に、テーブルからすべてのnan値をクリアする必要があります。 nanまたはNA値を削除する構文は次のとおりです。

df.dropna(inplace = True)

データフレームのすべての列の変換

構文:df。 astype (' data_type ')。dtypes

データフレーム全体のデータ型は、' data_typeに入れた値に変換されます'

データフレームの特定の列の変換

構文:df。 astype ({“ col_name ”:' data_type '})。dtypes

ここでの「col_name」には、入力として列名が必要です。 どの列名を入力しても、その列のデータ型は「 data_type」で指定した値に変更されます。

一度に複数の列を変換する

構文:df。 astype ({“ col_name ”:'data_type'、“ col_name ”:' data_type '、“ col_name ”:' data_type '})。dtypes

ここで行ったのは、変換するすべての列をコンマで区切ることだけでした。 構文の「 col_name 」と「 data_type 」には、単一の列を変換するときに必要な値と同じ値が必要です。

それを要約する

これがPandasDataFrame方法です。 astype ()メソッドが使用されます。 Pythonは、機械学習とデータサイエンスにも足を踏み入れたため、現在最も好まれるプログラミング言語の1つです。 Pythonがこれら2つの分野でどのように使用されているか、およびPythonがデータサイエンスでのキャリアにどのように役立つかを知りたい場合は、ブログですべてを読むことができます。 UpgradWebサイトにアクセスして、データサイエンスのエグゼクティブPGプログラム、または機械学習とディープのPG認定を取得できます。

パンダを学ぶのはどれくらい難しいですか?

PandasはPythonパッケージであるため、使用を開始する前にPython構文の基本に精通している必要があります。 基本的なパンダの構文は最初は奇妙に思えるかもしれませんが、練習すれば、グループ化、任意の軸への関数の適用、ピボットなどを学ぶことができます。 Pythonの多目的性は、機械学習の問題にも取り組むためのPandasライブラリの作成によって拡張されました。

PCに最新バージョンのパンダをインストールするにはどうすればよいですか?

最新バージョンのpipをダウンロードしてインストールします

2.最新バージョンのPythonをダウンロードします。 Pythonのインストールで問題が発生しないようにするには、Pythonのインストールが完了したら、パスの長さを無効にするオプションをクリックします。

3. Pythonがインストールされたので、コマンドプロンプトに移動し、そこからPandasをインストールする必要があります。 したがって、デスクトップの検索ボックスに移動し、「cmd」と入力します。 コマンドプロンプトと呼ばれるプログラムが表示されます。 開始するには、ボタンをクリックするだけです。

4.ここで、コマンドプロンプトでコマンド「pipinstallmanager」を実行します。 ダウンロードが完了するのを待つと、Pythonアプリケーション内からPandasを実行できるようになります。

Pythonでパンダを使用する際の制限は何ですか?

Pandasの構文の一部は、高度なレベルを使用すると複雑になる可能性があります。 多くのユーザーが標準のPythonコードとPandasの間を効率的かつスムーズに移動できないため、これは問題です。

2. Pandasフレームワークについて学習を進めていくと、いくつかの概念を理解するのが少し難しい場合があります。

3.データが3次元(3D)マトリックスにアップグレードされると、パンダはほとんど役に立ちません。パンダは3Dマトリックスの互換性が低いため、NumPyなどの他のライブラリに依存する必要があります。