【发布时间】:2016-01-06 11:59:07
【问题描述】:
我正在尝试在 yarn-cluster 模式下提交 python spark 应用程序。
Seq(System.getenv("SPARK_HOME")+"/bin/spark-submit","--master",sparkConfig.getString("spark.master"),"--executor-memory",sparkConfig.getString("spark.executor-memory"),"--num-executors",sparkConfig.getString("spark.num-executors"),"python/app.py") !
我收到以下错误,
诊断:文件不存在: hdfs://xxxxxx:8020/user/hdfs/.sparkStaging/application_123456789_0138/pyspark.zip java.io.FileNotFoundException:文件不存在: hdfs://xxxxxx:8020/user/hdfs/.sparkStaging/application_123456789_0138/pyspark.zip
我找到https://issues.apache.org/jira/browse/SPARK-10795
但是票还开着呢!
【问题讨论】:
标签: python hadoop apache-spark