【问题标题】:Deploy mode in "SPARK-SUBMIT"“SPARK-SUBMIT”中的部署模式
【发布时间】:2015-02-17 16:38:39
【问题描述】:

在 SPARK-SUBMIT 中,“yarn”、“yarn-cluster”、“yarn-client”部署模式有什么区别?

./bin/spark-submit \
  --class org.apache.spark.examples.SparkPi \
  --master yarn-cluster \  # can also be `yarn-client` for client mode
  --executor-memory 20G \
  --num-executors 50 \
  /path/to/examples.jar \
  1000

https://spark.apache.org/docs/1.1.0/submitting-applications.html

【问题讨论】:

    标签: apache-spark hadoop-yarn


    【解决方案1】:

    对于 YARN 上的 Spark,您可以指定 yarn-client 或 yarn-cluster。 Yarn-client 在与 spark submit 相同的 JVM 中运行驱动程序,而 yarn-cluster 在 NodeManager 的容器之一中运行 Spark 驱动程序。

    来自文档: https://spark.apache.org/docs/1.1.0/running-on-yarn.html 有两种部署模式可用于在 YARN 上启动 Spark 应用程序。在yarn-cluster模式下,Spark驱动运行在集群上由YARN管理的应用主进程中,客户端启动应用后即可离开。在yarn-client模式下,驱动运行在client进程中,application master只用于向YARN请求资源。

    【讨论】:

    • 谢谢....如果我只是指定“yarn”... {这是我现在正在做的方式} ..它的意思是“yarn-client”还是“yarn-cluster” ?
    • @user3279189 --master yarn 适用于较新版本的 spark。更多详情请查看spark.apache.org/docs/latest/…
    猜你喜欢
    • 2018-08-12
    • 1970-01-01
    • 1970-01-01
    • 2018-12-12
    • 2018-03-17
    • 2019-09-09
    • 1970-01-01
    • 2016-01-18
    • 2022-11-07
    相关资源
    最近更新 更多