【问题标题】:Dataproc how to run a initialization-actions script only on master node and skip running on worker nodesDataproc 如何仅在主节点上运行初始化操作脚本并跳过在工作节​​点上运行
【发布时间】:2022-01-01 08:46:33
【问题描述】:

我有一个用例,我想在 dataproc 中利用 initialization-actions 来运行将安装必要项目的脚本。我在 dataproc 上使用了几个初始化操作脚本,它们运行良好,并且确实安装在主节点和工作节点上。 但在这里,我只想在主节点上运行它

具体来说,我是安装在 yarn 主节点之上,这样它就会自动安装在其他节点(工作节点)上。

Dataproc 初始化操作中是否有任何标志会跳过工作节点上的安装?

【问题讨论】:

    标签: apache-spark google-cloud-platform initialization hadoop-yarn google-cloud-dataproc


    【解决方案1】:

    初始化动作不能被跳过,但它们可以包含节点角色特定的逻辑:

    ROLE=$(/usr/share/google/get_metadata_value attributes/dataproc-role)
    if [[ "${ROLE}" == 'Master' ]]; then
      #... master specific actions ...
    else
      #... worker specific actions ...
    fi
    

    查看doc了解更多详情。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-10-26
      相关资源
      最近更新 更多