Tableau 中预测的工作原理:创建预测

已发表: 2020-10-26

预测是关于预测每个模型的未来价值。 许多数学模型用于预测。 同时,Tableau 也是其中的佼佼者,精准的数据可视化工具主要专注于为商业智能行业生成。 数据预测对于预测至关重要,它基于生成的商业智能而发挥作用。 Tableau 可以与许多数据源一起使用,例如文本、No SQL 数据库、Excel、SQL 数据库等。

学习世界顶尖大学的在线数据科学课程获得行政 PG 课程、高级证书课程或硕士课程,以加快您的职业生涯。

指数平滑是 Tableau 中用于预测的技术 预测算法试图建立一个可用于未来连续性的规则模式。 您自然会在视图中添加预测,其中包含由一个度量组成的数据字段。 但是,Tableau 会创建一个预测以查看数据是否存在,该预测由具有整数值的维度和至少一个度量组成。

目录

预测算法

生成的真实世界数据需要更简单的算法才能产生更好的结果并且易于使用,Tableau 中的所有预测算法都可以使用这一点。 为了生成高质量的预测,模型生成的模式和现实世界的数据预测都应该合理匹配。 这里使用质量指标来衡量这种匹配。 如果质量低,则不考虑质量带置信带和质量分数,因为测试估计不准确。

在 Tableau 中进行预测,Tableau 反复选择顶部,最多 8 个模型; 首先选择最高质量的预测。 在 Tableau 评估预测质量之前,会优化每个模型的平滑参数。

优化方法是通用的并且在每个模型中都使用,使得无法选择不是全局最优的局部最优平滑参数。 但是,主要值参数是根据最佳实践选择的,并未进行优化。 因此,初始值参数有可能不是最优的。

当可视化数据受到限制时,Tableau 会自动尝试以更好的基于时间的粒度进行预测,然后将预测与可视化的粒度相加。 Tableau 提供了可以根据封闭式方程计算的预测组。 每个具有乘法分量或具有组合数据预测的模型都包含模拟波段,其中每个模型都基于封闭式方程。

指数平滑和趋势

指数平滑模型用于使用已知序列中过去值的有偏平均值来预测一致时间序列值中的未来值。 一种适度的模型是简单指数平滑; 在这里,计算基于加权平均值和最后一个实际值的平滑值。 这种方法是指数的,因为最近的值被赋予了更多的权重,并且每个值都基于之前的每个实际值。

当测量值在有效值上显示一段时间内的趋势或季节性时,季节性成分是有效的。 趋势是数据在给定时间段内增加或减少的属性。 季节性是价值搜索中反复出现的预期变化,例如降雨量波动或山洪暴发。

一般来说,当在一段时间内有大量数据可用时,可以产生更好的数据预测由于模型的复杂性,在对季节性进行建模时,拥有足够的数据是最重要的,只有通过更多可用的数据证明才能实现更高的精度。 由于限制,无法从 2 个或更多数据值生成预测。

季节性

估计 Tableau 试验中针对季节性周期的数据预测,通常使用时间序列中的时间聚合长度。 如果按月汇总,Tableau 将检查 12 个月的周期; 如果按季度汇总,则搜索四季度周期,如果按天汇总,则搜索每周季节性。 如果您考虑每月时间序列中的六个月周期,Tableau 将搜索包含两个类似子模式的年份模式。 如果考虑每月时间序列中的七个月周期,Tableau 将根本不搜索周期,因为它们不常见。

由于每个选项都是自动选择的,因此 Tableau 会从给定数据派生可能的季节长度,因此“预测选项”对话框“模型类型”菜单中的默认“自动”模型类型不会更改。 选择“自动无季节性”通过预测所有季节长度来帮助性能,正在探索和评估季节性模型。

模型类型

Tableau 中的预测中,当您选择“预测选项”对话框时,会为您提供用于数据的模型类型。 这里提供了默认的自动设置,这对于数据的主要视图是最佳的。 在自定义下,您需要在无、加法或乘法类型中指定趋势和季节特征。

资源

在加法模型中,模型组件的每个贡献被相加,而在乘法模型中,最小组件贡献被相乘。 乘法模型倾向于从数据的价值显着提高预测质量,趋势或季节性基于数据的大小。 由于乘法模型中涉及乘法,因此没有一个值需要为零或趋于零。

粒度和修整

要创建数据预测,时间维度选择对于在给定时间参考中查看和预测至关重要。 Tableau 日期提供了一系列时间单位,包括日、月、季度和年。 粒度是为日期选择的单位。

通常,数据不会与粒度单位精确对齐。 例如,如果您将数据设置为季度的值,实际数据可能会在季度之前停止。 模型会考虑在将模型预测为整个季度时进一步产生问题,该值通常低于整个季度的值。

如果允许数据预测模型选择数据,那么后续的预测就会不准确。 修剪数据是解决方案之一。 使用“数据预测选项”对话框中提供的“忽略最后一个”选项可以忽略使预测脱轨的跟踪周期默认选项是修剪/完成一个时期。

另请阅读:您必须了解的 16 个 Python 顶级数据科学项目

结论

基于时间的数据值有自己的规则和含义。 使用正确的数据量对于更好地预测和估计未来业务适应性至关重要。 Tableau中的预测非常可行,可以连接到任何软件,并用于根据数据价值获得未来丰富的数据预测。 Tableau中的预测会自动尝试预测趋势; 阅读本文后,您应该清楚“自动”的用法并不适合所有数据值。

学习 Tableau 对于渴望学习并在数据科学和可视化领域从事职业的个人来说至关重要。 了解概念和使用工具对于初学者来说相当棘手,而行业专家的学习提供了正确的开始。

如果您想了解数据科学,请查看 IIIT-B 和 upGrad 的数据科学执行 PG 计划,该计划是为在职专业人士创建的,提供 10 多个案例研究和项目、实用的实践研讨会、与行业专家的指导、1与行业导师一对一,400 多个小时的学习和顶级公司的工作协助。

什么是 Tableau?

Tableau 是一种快速扩展的可视化工具,可用于各种商业应用程序。 由于其易用性,它是一种流行的软件。 它通常用于商业智能 (BI) 程序。 Tableau 旨在使多种类型的图表、绘图和图形可以同时定位以进行显示。 对于 Tableau 中的数据类型和结构及其访问方式,它可以使用任何计算机语言对任何形式的数据进行操作,无论是结构化的还是非结构化的。 Tableau 提供了大量简单的工具,可以为任何数据生成基本图形或图表。

预测有什么用?

预测是一种使用已有数据作为输入的方法,可以对未来趋势的方向做出明智的预测。 行业使用预测来确定如何指定他们的资源或计划未来的预测成本。 预测与特定问题或一组事实有关。 根据发现的元素,选择适当的数据集并将其用于信息处理。 评估数据并做出预测。 验证阶段发生,在此期间将预测与实际结果进行比较,以便为未来的预测建立更准确的模型。

在 Tableau 上进行预测有什么好处?

Tableau 允许您在视觉对象中包含预测。 预测是根据过去的证据预先预测未来会发生什么的过程。 尽管预测在某种程度上是一种猜测,但大多数公司都利用它来帮助预测市场的走向。

Tableau 中的预测基于分析先前趋势以帮助预测未来结果的复杂模型。 Tableau 采用指数平滑方法,在这种方法中,最近的发现比旧的结果更重要。 在创建预测时,Tableau 会评估多达 8 个不同预测模型的结果,以确定哪个模型提供了最卓越的质量结果。