PandasGUIの探索[知っておくべき最高の機能のリスト]
公開: 2020-12-31Pandasは、データサイエンス愛好家のお気に入りのライブラリです。 構造化された表形式、日時形式を介してデータを処理し、パンダチェーン操作内でプロットを即座に実行するmatplotlibAPIを提供するというすべてのニーズに応えます。 Webサイトからデータフレームに直接データをロードできます。 このライブラリは、データセットとそれが整合するさまざまな分布に関する洞察を明らかにする探索的データ分析を実行するときにも非常に便利です。
データ探索を強化するためにますます多くのツールが構築されているため、Pandas GUIは、パンダをコアコンポーネントとして使用し、通常は手動で実行される多くの追加機能を備えたウィンドウGUIを表示するツールの1つです。
読む:初心者のための10のエキサイティングなPythonGUIプロジェクトとトピック
このユーティリティを調べて、いくつかの最高の機能を見てみましょう。
目次
PythonGUIの最高の機能
1.基本設定
これはPythonパッケージであるため、Pythonパッケージマネージャーであるpipを使用してPyPI経由で簡単にインストールできます。 このためのインストールコマンドは次のようになります。
pip install pandasgui
Pyqt、Plotlyなどのすべての依存関係は、このコマンドを介してインストールされます。 インストールが完了したら、pandasguiからpandasと1つの関数を含む2つのモジュールをインポートする必要があります。
パンダをpdとしてインポートします
pandasguiインポートショーから
show関数は、GUIディスプレイの主要なエントリポイントです。 パンダのデータフレームオブジェクトとして、分析を実行するデータセットを取り込みます。 このパッケージには、その機能をテストするためのデータセットがプリロードされています。 これに含まれるデータセットのいくつかは、アイリス、タイタニック、ポケモン、自動車事故、mpg、株式データ、ヒント、mi_manufacturing、gapminderです。 説明のために、ヒントデータセットを選択します。 このデータセットを読み込むには、
pandasgui.datasetsからインポートのヒント
コードの最後のステップは、show関数を呼び出してGUIユーティリティを使用することです。
GUI = show(tips)
これを実行するとすぐに、アプリケーションは表形式で入力されたデータといくつかのオーバーヘッドタブでプロンプトを表示します。 以下の画像を参照してください(この記事に示されているすべての画像は作成者によって提供されています)。
2.さまざまな画面上の機能
プログラムのさまざまなタブを調べる前に、画面上の主要な機能のいくつかについて説明しましょう。
- データセットの任意の列ヘッダー(total_bill、day…)をクリックすると、データはその特定の列の昇順で並べ替えられます。もう一度クリックすると降順で並べ替えられ、次にクリックすると並べ替えがリセットされます。 このようにして、データを簡単に並べ替えることができます。 ここでは、サイズの降順でデータを並べ替えています。
- このGUIには、ドラッグアンドドロップするだけで複数のCSVを追加できます。 すべてのファイルが左側のパネルに一覧表示されるため、ファイルを簡単に切り替えることができます。
- データ内の任意のセルをクリックすると、値を直接編集するオプションが表示されます。 これは、Excelシートが提供するものに似ており、パンダのGUIを便利にします。
- 左クリックを押しながらマウスをホバーして、必要なすべてのセルを選択することにより、データの任意のセクションを選択できます。 選択したセルは青色で強調表示され、この選択をそのままコピーできます。 このセクションをExcelシートまたはメモ帳に貼り付けることができます。
3.フィルター
データフレームの後の最初のタブは、ここで定義された条件に基づいてデータをフィルタリングできるファイラーです。 基盤となるパンダのデータフレームquery()関数を使用します。 これにより、ユーザーが必要とするデータセットの特定のセクションを除外できます。 アクセスするには、[フィルター]タブをクリックし、その後、データセットに対応するフィルターを作成します。 たとえば、次のように適用できます。

性別=='女性'、日=='金'および時間=='昼食'
結果のデータセットは次のようになります。
4.統計
高度な分析に進む前に、機能のデータ型、それらのカウント、最小-最大値などを確認することをお勧めします。pandasdescribe()関数はこの要約を提供します。 このGUIプレゼンテーションでは、[統計]タブが同じ役割を果たします。 データ型、カウント、一意の値のカウント、平均、標準偏差、および最小-最大が表示されます。
5.グラファー
名前が示すように、このタブは、データの視覚化の下にあるさまざまなタイプのグラフをプロットするためのアクセスを提供します。 今後の分析で実りあることが証明され、モデルトレーニングに選択する機能を決定するのに役立つ事実を明らかにできるように、データをプロットすることが不可欠です。 Pandas GUIは、ヒストグラム、散布図、線、棒、ボックス、バイオリン、ヒートマップ、パイ、さらにはワードクラウドをサポートします。
このGUIでプロットを構成するのは、簡単なドラッグアンドドロップ列です。 時間に関して与えられた合計請求額とチップの散布図をプロットするとします。 Grapherをクリックし、散布図を選択して、列名セクションのすぐ右側にあるxに合計請求額をドラッグし、[完了]をクリックしてプロットをレンダリングするだけです。
このタブで生成されるすべてのプロットは、Plotlyライブラリを使用して作成されているため、インタラクティブです。
必読: GitHubとGitLab:GitHubとGitLabの違い
6.リシェーパー
このタブには、ピボットテーブルとメルトの2つの機能があります。 ピボットテーブルは、ユーザーが複数の値を持つ列を独自の列に変換できるようにする、統計の重要で強力な機能です。 メルト機能は、ピボットの逆です。 これにより、列を単一の行に変換できます。 これらの関数は両方とも、データを要約する場合に便利です。
パンダは両方に別々の機能を提供し、GUIは、インデックス、列、ピボットの場合は値、メルトの場合はid_varsおよびvalue_varsとして渡される列のドラッグアンドドロップを提供します。
結論
Pandas GUIは、ユーザーがコアコーディングなしでデータセットを視覚的に処理できるようにする優れたプロジェクトです。 変更されたデータセットは、トップメニューの編集オプションからエクスポートできます。 このプロジェクトには、正規表現検索、このプロジェクトの将来のバージョンに統合される可能性のあるnull値の入力など、多くの機能がありませんが、オープンソースであるため、依然として非常に優れたツールです。 業界対応のツールをお探しの場合は、GoogleDataFlowをお試しください。
世界のトップ大学からデータサイエンスコースを学びましょう。 エグゼクティブPGプログラム、高度な証明書プログラム、または修士プログラムを取得して、キャリアを早急に進めましょう。
Pandas GUIとは何ですか?
Pandas GUIは、Pandasライブラリに基づくさまざまな機能を使用して、データフレームを探索し、それらを分析できるすばらしいインターフェイスです。 このシンプルなGUIベースのツールを使用すると、コーディングせずにすべての機能を使用できます。
データサイエンティストは、このツールがデータの分析、操作、フィルタリング、およびそれを使用したプロットの作成に非常に役立つことを発見しました。 これはすべて、タスクを効率的に実行するための多くの機能を備えたデスクトップGUIウィンドウを使用して、1行のコードなしで実行できます。
Pandasライブラリが提供する主な機能は何ですか?
Pandasライブラリが提供する最高の機能の1つは、データを簡単かつ効率的に操作できるデータフレームとシリーズです。 また、データに効率的にインデックスを付けるためのインテリジェントなデータ整理方法も付属しています。
データ操作機能とは別に、欠落値を処理するための統合ツールも提供します。 誤った結果を回避するために、データをクレンジングしてデータを分析できるようにする方法も付属しています。
システムにPandasライブラリを設定するにはどうすればよいですか?
PandasはPythonパッケージであるため、Pythonパッケージマネージャーであるpipを使用して、PyPIを使用して簡単にインストールできます。 エディターで、次のコマンドを実行しました:「pandasgui」。 Pyqt、Plotlyなどのすべての依存関係は、このコマンドを介してインストールされます。 インストールが完了したら、pandasguiからpandasと1つの関数を含む2つのモジュールをインポートする必要があります。 これらのモジュールは、「importpandasaspd」および「frompandasguiimportshow」コマンドを使用してインストールできます。