【发布时间】:2018-03-17 11:04:29
【问题描述】:
当我向 spark-submit 提供 spark.yarn.stagingDir 时遇到了一个场景,它开始失败,并且没有提供任何有关根本原因的线索,我花了很长时间才弄清楚这是因为 spark.yarn.stagingDir 参数。为什么提供spark.yarn.stagingDir这个参数时spark-submit失败?
查看相关问题here了解更多详情
失败的命令:
spark-submit \
--conf "spark.yarn.stagingDir=/xyz/warehouse/spark" \
--queue xyz \
--class com.xyz.TestJob \
--master yarn \
--deploy-mode cluster \
--conf "spark.local.dir=/xyz/warehouse/tmp" \
/xyzpath/java-test-1.0-SNAPSHOT.jar
当我删除 spark.yarn.stagingDir 时,它开始工作:
spark-submit \
--queue xyz \
--class com.xyz.TestJob \
--master yarn \
--deploy-mode cluster \
--conf "spark.local.dir=/xyz/warehouse/tmp" \
/xyzpath/java-test-1.0-SNAPSHOT.jar
异常堆栈跟踪:
应用程序 application_1506717704791_145448 完成失败 状态 在 org.apache.spark.deploy.yarn.Client.run(Client.scala:1167) 在 org.apache.spark.deploy.yarn.Client$.main(Client.scala:1213) 在 org.apache.spark.deploy.yarn.Client.main(Client.scala) 在 sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) 在 sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62) 在 sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) 在 java.lang.reflect.Method.invoke(Method.java:498) 在 org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:738)
【问题讨论】:
标签: scala apache-spark apache-spark-sql