【问题标题】:spark read file extension火花读取文件扩展名
【发布时间】:2019-03-15 17:35:06
【问题描述】:

我编写了以下 shell 脚本来配置纱线调度程序,但这不能正常工作 - 当我将此脚本设置为输入参数时,Dataproc 集群的创建失败。

您知道如何解决这个问题吗?

下面是脚本:

#!/usr/bin/env bash

echo "<allocations>" >> /etc/hadoop/conf/fair-scheduler.xml
echo "  <userMaxAppsDefault>999</userMaxAppsDefault>" >> /etc/hadoop/conf/fair-scheduler.xml
echo "  <queueMaxAppsDefault>999</queueMaxAppsDefault>" >> /etc/hadoop/conf/fair-scheduler.xml
echo "</allocations>" >> /etc/hadoop/conf/fair-scheduler.xml

sed -i '$ d' /etc/hadoop/conf/yarn-site.xml

echo "  <property>" >> /etc/hadoop/conf/yarn-site.xml
echo "    <name>yarn.scheduler.fair.allocation.file</name>" >> /etc/hadoop/conf/yarn-site.xml
echo "    <value>/etc/hadoop/conf/fair-scheduler.xml</value>" >> /etc/hadoop/conf/yarn-site.xml
echo "  </property>" >> /etc/hadoop/conf/yarn-site.xml
echo "</configuration>" >> /etc/hadoop/conf/yarn-site.xml

systemctl restart hadoop-yarn-resourcemanager.service

【问题讨论】:

    标签: shell hadoop-yarn google-cloud-dataproc


    【解决方案1】:

    您需要使用 Dataproc initialization action 在 Dataproc 上配置 YARN Fair Scheduler。

    您可以查看此答案以了解如何完成此操作的示例:https://stackoverflow.com/a/49693693/3227693

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-06-19
      • 2016-03-24
      • 2023-03-03
      相关资源
      最近更新 更多