【发布时间】:2019-10-31 22:35:22
【问题描述】:
目前比较基于 DAG 的工作流工具(如 Airflow 和 Luigi)来调度通用 docker 容器和 Spark 作业。
Apache Oozie 能否通过其shell 操作运行通用 Docker 容器?或者 Oozie 是否严格适用于 Pig 和 Hive 等 Hadoop 工具?
Oozie 与支持的 Hadoop 堆栈的其余部分集成在一起 开箱即用的几种类型的 Hadoop 作业(例如 Java map-reduce, 流式 map-reduce、Pig、Hive、Sqoop 和 Distcp)以及系统 特定的作业(例如 Java 程序和 shell 脚本)。
【问题讨论】:
-
Oozie 从 HDFS 获取作业可执行文件和资源,并启动 YARN 作业(即使对于普通的 bash shell)。句号。故事结束。
标签: docker workflow oozie oozie-workflow