前 9 名 Oozie 面试问题和答案 [适用于 2022 年的应届生和有经验者]

已发表: 2021-01-04

目录

介绍

Oozie 是有助于执行 Hadoop 作业的工作流。 这些作业可以安排在以后执行、监控和从任何地方处理。 完成这些Apache Oozie 面试问题并增加您被选中的机会。

如果您正在 Oozie 工作并准备面试,请阅读这些Apache Oozie 面试问题,因为它将帮助您以正确的方式修改您的 Oozie 概念。 Apache Oozie 是一个调度系统,有助于执行 Hadoop 作业。 动作节点和控制流节点构成了 Apache Oozie 的完整工作流程。

本文中给出Apache Oozie 面试问题将帮助您理清与 Oozie 相关的概念。 如果您想了解有关 apache Oozie 的更多信息,请不要担心,因为我们也提供课程,您可以申请并在培养技能的同时明确您的概念。

不仅是 Oozie,我们还有许多与所有技术主题相关的课程,因此,如果您正在为 Hadoop 管理员、Hadoop 顾问、Hadoop 架构师或任何相关角色做准备,那么请参加我们由专业教师准备的课程田野。 另外,在去面试之前,请记住阅读本文中分享的 Apache Oozie 面试问题。

问题 1:解释 Apache Oozie

Apache Oozie 是一个调度程序,允许用户调度和执行 Hadoop 作业。 用户可以并行执行多个任务,从而可以同时执行多个作业。 它是一个可扩展、可扩展且可靠的系统,支持不同类型的 Hadoop 作业。 这些作业包括 MapReduce 作业、Hive、流式作业、Scoop 和 Pig。

资源

问题 2:Apache Oozie 需要什么?

Apache Oozie 提供了一种处理多个作业的好方法。 用户希望安排不同类型的作业稍后运行,或者在执行期间需要遵循特定顺序的任务。 在 Apache Oozie 的帮助下,这些类型的执行可以变得很容易。 使用 Apache Oozie,管理员或用户可以并行执行各种独立的作业,按照一定的顺序背靠背地运行作业,或者可以从任何地方控制作业,因此非常有用。

阅读:印度的 Hadoop 开发人员薪水

问题 3:Apache Oozie 工作流的主要组成部分是什么?

Apache Oozie 工作流由控制流节点和操作节点组成。

下面是这些节点的解释:

  • 控制流节点:这些节点定义了工作流的开始和结束,即开始、结束和失败。 此外,它还提供了管理工作流中执行路径的机制,即decision、fork和join。
  • 动作节点:这些节点提供启动处理或计算任务执行的机制。 Oozie 支持不同的操作,包括 Hadoop MapReduce、Pig 和文件系统,以及特定于系统的作业,例如 HTTP、SSh 和电子邮件。

资源

问题4:Oozie中Join和Fork节点有什么用?

Oozie 中的 fork 和 join 节点是成对使用的。 fork 节点将执行路径拆分为多个并发执行路径。 连接节点将两个或多个并发执行路径连接为一个。 加入节点是同时加入以形成加入节点的分叉节点的子节点。

问题 5:Oozie 工作流程中有哪些有用的 EL 函数?

以下是 Oozie 工作流的一些有用的 EL 函数列表:

  • wf: name() - 它返回工作流中的应用程序名称。
  • wf: id() - 此函数返回当前运行的工作流作业的作业 ID。
  • wf:errorCode(String node) – 返回执行动作节点的错误代码。
  • wf:lastErrorNod() – 此函数返回工作流中最后执行的操作节点的名称,该操作节点因错误而退出。

阅读: Hadoop 面试问答

问题 6:解释 Oozie 工作流中支持的不同节点。

以下是 Apache Oozie 工作流在计算任务中支持和帮助的操作节点列表:

  • Map Reduce Action:此操作节点启动 Hadoop Map-Reduce 作业
  • Pig Action:此节点用于从 Apache Oozie 工作流启动 Pig 作业。
  • FS (HDFS) Action:此操作节点允许 Oozie 工作流操作所有与 HDFS 相关的文件和目录。 此外,它还支持 mkdir、move、chmod、delete、chgrp 和 touchz 等命令。
  • Java Action:它是子工作流动作节点,有助于在 Oozie 工作流中执行主要 java 类的 public static void main(String[] args) 方法。

资源

问题 7:什么是 Oozie Bundle?

Oozie bundle 允许用户批量执行作业。 Oozie 捆绑作业分批启动、停止、暂停、恢复、重新运行或终止,从而提供更好的操作控制。

资源

问题 8:解释管道在 Oozie 中的工作原理

Oozie 中的管道有助于连接工作流中的多个作业,该工作流定期执行但在不同的时间间隔内执行。 在此管道中,多次执行工作流的输出成为工作流中下一个计划作业的输入,该作业在管道中背靠背执行。 连接的工作流程链形成了 Oozie 作业管道。

问题 9:解释 Oozie 工作流作业的生命周期

Apache Oozie 工作流中的工作通过打击状态转换:

  • PREP –这是用户创建工作流作业时的状态。 在 PREP 状态期间,作业仅被定义并且未运行。
  • RUNNING –当作业启动时,它会更改为 RUNNING 状态并保持此状态,直到作业达到结束状态、发生错误或作业被挂起。
  • SUSPENDED –如果作业在两者之间暂停,Oozie 工作流中的作业状态将更改为 SUSPENDED。 作业将保持此状态,直到它被终止或恢复。
  • SUCCEEDED –当作业到达结束节点时,工作流作业变为 SUCCEEDED。
  • KILLED –当管理员终止任何处于 PREP、RUNNING 或 SUSPENDED 状态的作业时,工作流作业将转换为 KILLED 状态
  • FAILED –当正在运行的作业由于意外错误而失败时,作业状态变为 FAILED 状态。

资源

另请阅读:印度的 Apache Spark 开发人员薪水:适合新人和有经验的人

结论

这些Apache Oozie 面试问题将有助于您为下一次个人面试做好面试准备。 这些是面试官在与 Oozie 相关的面试中非常频繁地向受访者提出的问题。 在参加面试之前,您必须查看这些Apache Oozie 面试问题,因为这些问题将帮助您修改概念并增强您的信心。

另外,不要忘记访问我们的网站以了解有关相关课程的更多信息。 祝您面试顺利,学习愉快!

如果您有兴趣了解有关大数据课程的更多信息,请查看我们的大数据软件开发专业化 PG 文凭课程,该课程专为在职专业人士设计,提供 7 多个案例研究和项目,涵盖 14 种编程语言和工具,实用的动手操作在研讨会上,超过 400 小时的严格学习和顶级公司的就业帮助。

从世界顶级大学在线学习软件开发课程获得行政 PG 课程、高级证书课程或硕士课程,以加快您的职业生涯。

掌握未来的技术 - 大数据

超过 400 小时的学习时间。 14 种语言和工具。 IIIT-B 校友身份。
IIIT Bangalore 大数据高级证书课程