【发布时间】:2017-09-08 17:10:21
【问题描述】:
我已经开始使用 Python 开发 Spark。我正在开发一个使用 SparkML 线性回归 API 的应用程序。当我在 YARN 集群模式下提交作业时,在执行阶段,许多 pyspark-shell 应用程序都以 YARN 作为用户创建。我可以在 YARN UI 中看到它们。他们最终以成功状态完成,而我实际提交的主要应用程序随后以成功状态完成。这是预期的行为吗?这对我来说有点有趣,因为我创建了单例 sparkSession 实例并在整个应用程序中使用它,所以我不知道为什么会创建 pyspark-shell 会话/应用程序。
【问题讨论】:
-
我也面临这个问题,似乎只发生在某些脚本上
-
我遇到了同样的问题。你解决了@Sivaprasanna Sethuraman 的问题了吗?这就是我开始会话 SparkSession.builder.appName("app-name").getOrCreate() 的方式
标签: apache-spark pyspark apache-spark-ml