【发布时间】:2015-10-29 19:14:26
【问题描述】:
当我使用 Tez 提交 Hive SQL 时,如下所示:
hive (default)> select count(*) from simple_data;
在资源管理器 UI 中,作业名称显示为 HIVE-9d1906a2-25dd-4a7c-9ea3-bf651036c7eb 之类的内容有没有办法将作业名称更改为my_job_nam?
如果我不使用 Tez 并在 MR 中运行作业,我可以使用 set mapred.job.name 设置作业名称。
我需要设置任何 Tez 参数来更改作业名称吗?
感谢任何输入。
【问题讨论】:
-
MR 将为每个查询运行一个新作业;但 TEZ 将尝试保持其“会话”打开,以避免一直取消分配和重新分配 YARN 容器。所以您的问题是如何设置当前(或未来)TEZ 会话名称。请参阅fr.hortonworks.com/blog/introducing-tez-sessions >> 不幸的是,HIVE 不知道 TEZ 的工作原理,也没有具体的参数...
-
顺便说一句:在 YARN 和 TEZ 作业(尤其是 OOZIE 作业管理)中支持 自定义标签 的请求由来已久,但这些 JIRA 显示不多进度,见issues.apache.org/jira/browse/TEZ-909
-
非常感谢 Samson 提供的信息。
标签: hadoop hive apache-pig