パンダの既存のデータフレームに新しい列を追加する[2022]

公開: 2021-01-06

インタプリタされた汎用の高級プログラミング言語であるPythonは、その膨大なライブラリのコレクションと実装が容易な性質により、最近驚異的なコンピューティング言語になりました。 Pythonの人気は、データサイエンスとデータ分析の実装で大きな飛躍を遂げました。 Pythonと統合して、あらゆる分野で効率的に機能させることができるライブラリは数千あります。

Pandasは、Pythonがデータ操作とデータ分析を実行するために明示的に設計されたそのようなデータ分析ライブラリの1つです。 Pandasライブラリは、数値テーブルを処理し、データを分析し、時系列を処理するための特定のデータ構造と操作で構成されています。 この記事では、すでに存在するパンダのDataFrameに列を追加する方法を学びます。

読む: Pandas Dataframe Astype

目次

DataFrameとは何ですか?

既存のDataFrameに新しい列を追加する方法を知る前に、まずPandasのDataFrameを垣間見てみましょう。 DataFrameは、ラベル付けされた軸(行と列)を持つ異種の値を格納できる2次元配列の形式の可変データ構造です。 DataFrameは、データが表形式(行と列が交差する)形式で論理的に配置されたままのデータ構造です。 DataFrameの3つの主要なコンポーネントは、行、列、およびデータです。 PythonでのDataFrameの作成は非常に簡単です。

パンダをpdとしてインポートします

l = ['This'、'is'、'a'、'List'、'preparing'、'for'、'DataFrame']

datfr = pd.DataFrame(l)

print(datfr)

上記のプログラムは、7行1列のDataFrameを作成します。

パンダの既存のデータフレーム

既存のデータフレームに列を追加する方法は?

PandasのDataFrameに新しい列を追加するにはさまざまな方法があります。 Pandasライブラリを使用して基本的なDataFrameを作成する方法のアイデアはすでに集まっています。 ここで、既存のライブラリを準備して作業しましょう。

パンダをpdとしてインポートします

#専門家のデータを含む辞書を定義する

datfr = {'Name':['Karl'、'Gaurav'、'Ray'、'Mimo']、

「高さ」:[6.2、5.7、6.1、5.9]、

'指定':['科学者'、'教授'、'データアナリスト'、'セキュリティアナリスト']}

df = pd.DataFrame(datfr)

print(df)

出力:

読む: Pythonパンダチュートリアル

テクニック1:insert()メソッド

ここで、既存のDataFrameに新しい列を追加するには、insert()メソッドを使用する必要があります。 insert()メソッドを実装する前に、その動作についてお知らせください。 DataFrame.insert()を使用すると、データアナリストが希望する任意の位置に列を追加できます。 また、列の値を挿入するためのいくつかの可能性にも対応しています。 プログラマーは、その特定の位置にデータの列を挿入するためのインデックスを指定できます。

パンダをpdとしてインポートします

#専門家のデータを含む辞書を定義する

datfr = {'Name':['Karl'、'Gaurav'、'Ray'、'Mimo']、

「高さ」:[6.2、5.7、6.1、5.9]、

'指定':['科学者'、'教授'、'データアナリスト'、'セキュリティアナリスト']}

df = pd.DataFrame(datfr)

df.insert(3、“ Age”、[40、33、27、26]、True)

print(df)

insert()メソッドで定義されているように、最初のパラメーターとして3番目のインデックス位置に「Age」列を追加します。

テクニック2:assign()メソッド

DataFrameに列を追加する別のメソッドは、Pandasライブラリのassign()メソッドを使用することです。 このメソッドは、別のアプローチを使用して、既存のDataFrameに新しい列を追加します。 Dataframe.assign()は、列とともに新しいDataFrameを作成します。 次に、それを既存のDataFrameに追加します。

パンダをpdとしてインポートします

datfr = {'Name':['Karl'、'Gaurav'、'Ray'、'Mimo']、

「高さ」:[6.2、5.7、6.1、5.9]、

'指定':['科学者'、'教授'、'データアナリスト'、'セキュリティアナリスト']}

dfI = pd.DataFrame(datfr)

dfII = dfI.assign(Location = ['Noida'、'Amsterdam'、'Cambridge'、'Bangaluru'])

print(dfII)

出力:

テクニック3:列として新しいリストを作成する

プログラマーがDataFrameに列を追加するために使用できる最後の方法は、データの別個の列として新しいリストを生成し、その列を既存のDataFrameに追加することです。

パンダをpdとしてインポートします

datfr = {'Name':['Karl'、'Gaurav'、'Ray'、'Mimo']、

「高さ」:[6.2、5.7、6.1、5.9]、

'指定':['科学者'、'教授'、'データアナリスト'、'セキュリティアナリスト']}

df = pd.DataFrame(datfr)

loc = ['ノイダ'、'アムステルダム'、'ケンブリッジ'、'バンガロール']

df ['Location'] = loc

print(df)

出力:

チェックアウト:PandasInteviewの質問

結論

データアナリストは、列単位の形式でデータのセットを追加するための主要な操作を実行します。 データアナリストまたはプログラマーがPandasの既存のDataFrameに新しい列を追加するために使用できるさまざまなアプローチがあります。 これらのメソッドにより、プログラマーはパンダのデータを分析している間、いつでもデータ列を追加できます。

パンダのDataFrameについて知りたい場合は、IIIT-B&upGradのデータサイエンスのエグゼクティブPGプログラムをチェックしてください。これは、働く専門家向けに作成され、10以上のケーススタディとプロジェクト、実践的なハンズオンワークショップ、業界の専門家とのメンターシップを提供します。業界のメンターとの1対1、400時間以上の学習、トップ企業との仕事の支援。

PandasがPythonでデータフレームを作成するのに最も好ましいライブラリの1つであるのはなぜですか?

Pandasライブラリは、データフレームの作成を効率化するさまざまな機能を提供するため、データフレームの作成に最適であると考えられています。 これらの機能の一部は次のとおりです。パンダは、効率的なデータ表現を可能にするだけでなく、それを操作することもできるさまざまなデータフレームを提供します。 データにラベルを付けて整理するインテリジェントな方法を提供する、効率的な配置およびインデックス作成機能を提供します。 Pandasの一部の機能により、コードがクリーンになり、読みやすさが向上するため、コードがより効率的になります。 また、複数のファイル形式を読み取ることもできます。 JSON、CSV、HDF5、およびExcelは、Pandasでサポートされているファイル形式の一部です。 複数のデータセットをマージすることは、多くのプログラマーにとって大きな課題でした。 パンダもこれを克服し、複数のデータセットを非常に効率的にマージします。 Pandasは、MatplotlibやNumPyなどの他の重要なPythonライブラリへのアクセスも提供するため、非常に効率的なライブラリになります。

Pandasライブラリが動作する他のPythonライブラリは何ですか?

Pandasは、データフレームを作成するための中央ライブラリとして機能するだけでなく、Pythonの他のライブラリやツールと連携してより効率的に機能します。 PandasはNumPyPythonパッケージに基づいて構築されており、Pandasライブラリ構造のほとんどがNumPyパッケージから複製されていることを示しています。 Pandasライブラリのデータの統計分析は、SciPyによって操作され、Matplotlibに関数をプロットし、Scikit-learnの機械学習アルゴリズムを使用します。 Jupyter Notebookは、IDEとして機能し、パンダに適した環境を提供するWebベースのインタラクティブ環境です。

挿入に加えて、データフレームの基本的な操作は何ですか?

追加や削除などの操作を開始する前に、インデックスまたは列を選択することが重要です。 値にアクセスしてデータフレームから列を選択する方法を学習したら、Pandasデータフレームにインデックス、行、または列を追加する方法を学習できます。 データフレームのインデックスが希望どおりにならない場合は、リセットできます。 インデックスをリセットするには、「reset_index()」関数を使用できます。