探索 Pandas GUI [您应该了解的最佳功能列表]
已发表: 2020-12-31Pandas 是任何数据科学爱好者最喜欢的库。 它满足通过结构化表格格式、日期时间格式处理数据的所有需求,并提供 matplotlib API 以在 pandas 链接操作中即时执行绘图。 您可以将来自网站的数据直接加载到数据框中。 该库在执行探索性数据分析时也非常方便,可以揭示有关数据集及其与之对齐的各种分布的见解。
随着越来越多的工具被构建来增强数据探索,Pandas GUI 就是其中之一,它以 pandas 为核心组件并显示一个带有许多通常手动执行的附加功能的窗口 GUI。
阅读:10 个令人兴奋的 Python GUI 项目和初学者主题
让我们探索这个实用程序并看看一些最好的功能。
目录
Python GUI 的最佳特性
1. 基本设置
它是一个 Python 包,因此可以使用 Python 包管理器 pip 通过 PyPI 轻松安装。 为此的安装命令将是:
点安装pandasgui
Pyqt、Plotly 等所有依赖项都将通过此命令安装。 安装完成后,需要从pandasgui中导入包含pandas的两个模块和一个函数。
将熊猫导入为 pd
来自 pandasgui 进口秀
show 函数是 GUI 显示的主要入口点。 它将您要对其执行分析的数据集作为 pandas 的数据框对象。 这个包带有预加载的数据集来测试它的功能。 其中包含的一些数据集是iris、titanic、pokemon、car crash、mpg、stock data、tips、mi_manufacturing、gapminder 。 出于说明目的,我们将选择tips 数据集。 要加载此数据集,
从 pandasgui.datasets 导入提示
现在代码的最后一步是调用 show 函数并使用 GUI 实用程序:
GUI = 显示(提示)
运行此程序后,应用程序将提示以表格格式填充的数据和一些开销选项卡。 见下图(本文所有图片均由作者提供):
2.各种屏幕功能
在探索程序的各个选项卡之前,让我们讨论一些关键的屏幕功能:
- 如果单击数据集的任何列标题(total_bill,day...),数据将根据该特定列的升序排序,再次单击将按降序排序,下一次单击将重置排序。 通过这种方式,您可以轻松地对数据进行排序。 在这里,我们按大小降序对数据进行了排序:
- 您只需拖放即可在此 GUI 中添加多个 CSV。 所有文件都将列在左侧面板上,便于在它们之间切换
- 如果单击数据中的任何单元格,则可以选择直接编辑值。 这类似于 excel 表格提供的内容,这使得 pandas GUI 很有用。
- 您可以通过按住左键并悬停鼠标选择所有需要的单元格来选择数据的任何部分。 所选单元格将以蓝色突出显示,并且可以按原样复制此选择。 您可以将此部分粘贴到 Excel 工作表或记事本中!
3. 过滤器
数据框后的第一个选项卡是允许根据此处定义的条件过滤数据的文件管理器。 它使用底层 pandas 的数据框 query() 函数。 这使得过滤掉用户需要的数据集的特定部分成为可能。 要访问它,只需单击过滤器选项卡,然后创建与您的数据集对应的过滤器。 例如,我们可以申请:

性别 == '女性' ,天 == '星期五' 和时间 == '午餐'
生成的数据集如下所示:
4.统计
在进行高级分析之前,最好先查看特征的数据类型、计数、最小值-最大值等。pandas describe() 函数提供了此摘要。 在此 GUI 演示中,统计选项卡执行相同的工作。 它显示数据类型、计数、唯一值计数、平均值、标准差和最小值-最大值。
5. 绘图员
顾名思义,此选项卡提供了绘制数据可视化下不同类型图表的访问权限。 绘制我们的数据非常重要,这样我们才能发现可以在即将进行的分析中证明富有成效的事实,并有助于决定我们要为模型训练选择哪些特征。 Pandas GUI 支持直方图、散点图、线条、条形图、盒子、小提琴、热图、饼图,甚至是词云。
在此 GUI 中配置绘图是一个简单的拖放列。 假设您要绘制一个散点图,以显示与时间相关的总账单和小费。 只需单击 Grapher,选择散点图,然后将总帐单拖到列名部分右侧的 x 中,然后单击完成即可渲染绘图
此选项卡生成的所有绘图都是交互式的,因为它们是使用 Plotly 库构建的。
必读: GitHub vs GitLab:GitHub 和 GitLab 之间的区别
6. 整形器
此选项卡提供两个功能:数据透视表和熔化。 数据透视表是统计数据的一项重要且强大的功能,它允许用户将具有多个值的列转换为他们自己的列。 熔体功能与旋转相反。 它允许将列转换为单行。 当您想要汇总数据时,这两个函数都会派上用场。
pandas 为两者提供了单独的功能,GUI 提供了列的拖放功能,以作为索引、列、值在 pivot 的情况下和 id_vars 和 value_vars 在熔化的情况下传递。
结论
Pandas GUI 是一个很棒的项目,它允许用户在没有任何核心编码的情况下直观地处理数据集。 修改后的数据集可以从顶部菜单编辑选项中导出。 该项目缺少更多功能,例如正则表达式搜索,填充空值,可能会集成到该项目的未来版本中,但作为开源,它仍然是一个非常棒的工具。 如果您正在寻找适合行业的工具,那么您可以尝试 Google DataFlow。
学习世界顶尖大学的数据科学课程。 获得行政 PG 课程、高级证书课程或硕士课程,以加快您的职业生涯。
什么是熊猫 GUI?
Pandas GUI 是一个令人惊叹的界面,可让您探索数据帧并使用基于 Pandas 库的各种功能对其进行分析。 通过使用这个简单的基于 GUI 的工具,您可以使用所有功能而无需编码。
数据科学家发现这个工具对于分析、操作、过滤数据和使用它创建图表非常有用。 所有这一切都可以使用桌面 GUI 窗口完成,无需一行代码,该窗口具有许多功能,可以有效地完成您的任务。
Pandas 库提供哪些主要功能?
Pandas 库提供的最佳功能之一是数据框和系列,可让您轻松高效地操作数据。 它还带有智能数据组织方法,可以有效地索引您的数据。
除了数据操作功能外,它还提供了处理缺失值的集成工具。 为了避免错误的结果,它还带有清理数据的方法,以便您可以准备好数据进行分析。
如何在您的系统中设置 Pandas 库?
由于 Pandas 是一个 Python 包,因此您可以使用 Python 包管理器 pip 轻松地使用 PyPI 安装它。 在您的编辑器中,您运行了以下命令:“pandasgui”。 Pyqt、Plotly 等所有依赖项都将通过此命令安装。 安装完成后,需要从pandasgui中导入包含pandas的两个模块和一个函数。 可以使用以下命令安装这些模块:“import pandas as pd”和“from pandasgui import show”。