Tableau 架构:组件、客户端、它是如何工作的?

已发表: 2020-01-30

Tableau 是大数据专业人士的必备工具之一。 它可以帮助您通过详细的可视化显示您的数据发现。 Tableau 分为许多组件; 这就是为什么了解 Tableau 架构对于任何有志于数据科学的人来说都是必不可少的。 它使数据分析变得容易,并帮助您执行各种任务,包括访问数据库、协作项目、生成报告等。

目录

数据来源

在使用 Tableau 进行数据可视化之前,您需要使用一些数据。 为此,您必须将数据源添加到 Tableau 架构中。 数据源是该架构的第一个组件。 您可以使用多种来源将数据添加到您的服务器。 这些选项包括 MySQL、Salesforce、Oracle、Excel 文件等。

Tableau 最好的一点是它可以同时连接多个来源。 它融合了从这些来源收到的数据,为您提供准确的结果。 您也可以一次组合各种类型的源。 这意味着您可以选择将 Excel 文件与 Web 应用程序连接起来,并从它们中提取数据。

数据连接

您需要一个数据连接器来将数据从源传输到服务器。 Tableau 使用 OBDC/SQL 连接器执行此任务。 您可以通过数据库的本机连接器将此连接用于任何数据库。

Tableau 为您提供了两个用于存储此传输数据的选项。 这些选项是:

  1. 实时数据
  2. 提取数据

两者都有其特定的特点。 让我们简要讨论一下:

实时数据:

您可以在此方法中直接从外部源传输数据。 Tableau 发送 SQL 语句和多维表达式以传输数据。 您不必为了使用它而导入数据。 当您需要使用获取实时更新的数据源时,它很有用。

当您将 Tableau 用作实时数据源的数据可视化工具时,可以使用此方法。

提取数据:

除了依赖实时数据源之外,您还可以从特定源检索数据。 Tableau 使您能够将数据的本地副本创建为提取文件。 Tableau 的数据提取能够从数据源中提取数百万条记录。 简单的界面可确保数据提取对您来说并不复杂。

您可以将提取的数据存储在 Tableau 的数据引擎中。 它将数据保存在 ROM、RAM 和高速缓存中,以便更好地访问。 您还可以选择使用过滤器从大型数据集中提取特定记录。 这样,您可以节省许多资源并更快地完成该过程。

这两个功能都有其优点。 实时数据让您可以处理实时数据而不会遇到任何中断,而提取的数据让您可以选择使用 Tableau 进行离线可视化。 如果您使用提取的数据,则无需连接数据源即可使用 Tableau。

表服务器

Tableau Server 是 Tableau 的重要组件。 它的多个组件有助于管理各种任务。 它将数据存储在存储库中,保护用户数据的安全,并执行许多类似的基本任务。

Tableau Server 的组件

数据引擎

数据引擎优化分析过程的速度以提高效率。 它创建、刷新或查询数据提取。 当您使用具有多个连接的数据源时,它还可以帮助您进行跨数据库连接。 多个其他组件(例如 VizQL Server 和 Data Server)使用此组件的本地实例来执行跨数据库连接。 除此之外,他们还使用数据引擎来生成阴影提取。

数据引擎主要在您使用 TDE(Tableau 数据提取)时工作。 它可以存储许多 TDE 并在各种服务器上运行它们。 它还可以同时处理多个请求以提高效率。 如果需要,它可以保存从 TDE 中提取的数据。

应用服务器

应用服务器提供身份验证和权限。 它处理登录请求、用户权限和域身份验证。 它通过在 Tableau 服务器中记录每个会话来确保您的流程安全。 它还处理与不涉及数据可视化的 VizQL 服务器相关的进程。

网关

该网关使 Tableau 客户端能够通过 HTTP(或 https)与服务器通信。 如果需要,您可以在服务器环境的集群的每个节点上运行单个网关进程。 如果您的服务器需要使用 SSL,请确保证书位于连接到集群的每台计算机的相同位置。

Tableau 服务器接收到许多请求,它必须将它们定向到正确的服务器。 网关处理与服务器相关的多个进程。 它向客户端发送文件、重写 URL 等。当客户端发送请求时,它会转到负载均衡器。 网关将这些请求从负载均衡器分发到适当的组件。 如果系统缺少网关,网关也可以充当负载均衡器。

背景资料

顾名思义,backgrounder 在后台执行任务。 它处理服务器和数据引擎的计划以实现更好的操作。 它可以同时管理多个进程。 与数据引擎一样,后台程序会消耗服务器上的大量处理能力。 除了 TDE,它还有助于重建搜索索引、检查可用磁盘空间和同步目录组。

VizQL 服务器

VizQL 服务器将数据转换为可视化,因此它无疑是 Tableau 服务器架构的重要组成部分。 当客户端请求可视化时,它被发送到 VizQL,VizQL 将其转换为 SQL 语句。 然后,VizQL 将其发送到请求从其发送回 VizQL 的数据源。 之后,它会添加一些计算并将最终产品发送给用户。

VizQL 服务器创建可视化缓存以减少加载时间。 如果多个用户拥有可视化权限,他们也会收到相同的缓存。

存储库

该组件处理分配、用户、项目和权限的服务器元数据。 每当一个部分需要任何元数据时,存储库都会相应地发送相同的元数据。 它还以平面文件的形式存储可视化。 它还可以存储性能数据以供将来审计。 它与活动目录一起工作,将信息发送到应用服务器进行登录验证。

数据服务器

它管理来自外部来源的数据。 数据服务器处理存储、数据连接、安全性、驱动程序要求和元数据管理。 它还存储与存储数据相关的详细信息,例如参数、计算等。数据服务器使您能够集中元数据管理。 它还处理阻止任何用户访问数据源的请求。

许可和搜索

顾名思义,许可证组件处理服务器的许可任务。 另一方面,搜索部分允许您搜索存储库中的索引以满足您的要求。 虽然这些组件看起来很简单,但它们对于服务器的正常运行至关重要。

您一定已经注意到 Tableau 架构有多么庞大。 现在您已经了解了 Tableau Server,我们可以看看下一部分,Tableau 客户端。

Tableau 客户端(桌面、移动和浏览器)

您用于访问 Tableau 的移动设备、云端、Web 应用和本地界面称为客户端。 这些最终用户与服务器交互以访问可视化或数据。 您将通过客户端发送访问数据的请求,然后客户端将相应地显示可视化。

Safari、Google Chrome 和 Mozilla Firefox 等 Web 浏览器可以让您通过 Tableau Online 的仪表板编辑可视化内容。 为此,您还可以使用 Tableau Desktop。 它使您能够在服务器中创建和管理仪表板。 Tableau 还允许您通过移动应用程序访问和使用服务器。

Tableau desktop 可帮助您使用从源接收的数据创建仪表板、工作簿和可视化。 您还可以将结果发布到服务器以供将来使用。 此工具还允许您根据平板电脑、手机和 PC 为仪表板创建自定义设计。

Tableau Server 架构的工作原理

Tableau Server 体系结构的各种组件协同工作,为您提供所需的结果。 服务器促进数据连接器和可视化器之间的通信。 在讨论了不同组件的具体功能之后,让我们看看它们是如何协同工作的。

  • 首先,数据源通过连接器发送数据,并通过数据引擎和存储库。 数据引擎处理接收到的数据并相应地分配其值(例如数据类型和维度)。
  • SQL 连接器是数据引擎的一部分,它生成用于处理用户请求的 SQL 查询。
  • 在这些组件之后是数据服务器。 它处理数据连接器的操作以确保它们正常工作。 然后将数据发送到 VizQL 服务器,然后再发送到应用程序服务器。 在应用程序服务器确定其接收的请求类型时,VizQL 服务器会创建所需的可视化。
  • 在最后阶段,网关处理查询和用户请求。 如果需要,它充当主服务器,向辅助服务器发送请求。

获得世界顶尖大学的数据科学认证加入我们的行政 PG 课程、高级证书课程或硕士课程,以加快您的职业生涯。

想要了解有关 Tableau 的更多信息?

在数据分析方面,Tableau 是一个强大的工具。 在本指南中,我们了解了 Tableau 架构、其服务器及其组件。 您一定已经看到它的各个部分如何协同工作,从而为您提供强大的数据可视化工具。 许多组织都使用 Tableau。

对该工具的支持也令人印象深刻。 他们发布定期更新,因此您不会遇到错误或任何其他技术原因的问题。 您可以在我们的博客中了解有关 Tableau 和数据分析工具的更多信息

如果您想了解 Tableau,请查看 IIIT-B 和 upGrad 的数据科学 PG 文凭,该文凭专为在职专业人士而设,提供 10 多个案例研究和项目、实用的实践研讨会、行业专家指导、一对一-1 与行业导师,400 多个小时的学习和顶级公司的工作协助。

在 Tableau Server 中,如何清除缓存?

必须终止服务才能删除缓存。 要停止 Tableau Server,请使用“tabadmin stop”命令。 您可能希望在服务停止后执行“tabadmin status”命令,以确保它确实已停止。 之后,您可以使用 clean cache 命令。

在 Tableau 中,如何隐藏不需要的列?

隐藏列在以下情况下很有用:列对于行级别的特定性是必需的,但不希望显示,或者通过隐藏不需要的列使您的表更易于管理/解释。 要隐藏一个字段,只需右键单击它并选择“隐藏”。 请注意,您可以通过使用数据窗口右上角的下拉菜单并选择“隐藏所有未使用的字段”来轻松隐藏所有不必要的字段。

Tableau Public 与 Tableau Reader 有何不同?

Tableau Public 是可视化程序 Tableau 的免费版本。 它使您能够使用该软件的大部分功能。 您可以链接到 CSV、文本和 Excel 文档以构建可视化。 最显着的区别是 Tableau Public 不允许您在本地存储工作表。 您可以使用 Tableau Reader 读取 Tableau 文件格式。 如果您通过电子邮件发送文件以共享您的工作簿,收件人将需要 Tableau 阅读器才能访问该文件。