【问题标题】:Error while running Zeppelin paragraphs in Spark on Linux cluster in Azure HdInsight在 Azure HdInsight 的 Linux 群集上的 Spark 中运行 Zeppelin 段落时出错
【发布时间】:2016-04-13 06:18:58
【问题描述】:

我一直在关注此tutorial,以便在 Linux 上的 HDInsight 中的 Spark 群集(版本 1.5.2)上设置 Zeppelin。一切正常,我已成功通过 SSH 隧道连接到 Zeppelin 笔记本。但是,当我尝试运行任何类型的段落时,我第一次收到以下错误:

java.io.IOException: No FileSystem for scheme: wasb

收到此错误后,如果我尝试重新运行该段落,则会收到另一个错误:

java.net.SocketException:管道损坏 在 java.net.SocketOutputStream.socketWrite0(Native Method)

无论我输入什么代码,这些错误都会发生,即使没有对 hdfs 的引用。我的意思是,即使对于微不足道的 scala 表达式(例如并行化),我也会收到“No FileSystem”错误。

是否缺少配置步骤?

【问题讨论】:

  • 看来他们更新了脚本。我刚刚尝试了更新版本,它适用于我的 Spark 1.5.2 集群。
  • 你是对的,他们已经更新了脚本并且确实有效。谢谢!

标签: linux azure apache-spark azure-hdinsight apache-zeppelin


【解决方案1】:

我正在下载您在我键入时指向的脚本的 tar 球。但我猜想你的 zeppelin install 和 spark install 不完整,无法与 wasb 一起使用。为了让 spark 与 wasb 一起工作,您需要在 Class 路径中添加一些 jar。为此,您需要在 spark-defaults.conf 中添加类似的内容(HDInsights 中的路径可能不同,这是来自 IaaS 上的 HDP)

spark.driver.extraClassPath /usr/hdp/2.3.0.0-2557/hadoop/lib/azure-storage-2.2.0.jar:/usr/hdp/2.3.0.0-2557/hadoop/lib/microsoft-windowsazure-storage-sdk-0.6.0.jar:/usr/hdp/2.3.0.0-2557/hadoop/hadoop-azure-2.7.1.2.3.0.0-2557.jar
spark.executor.extraClassPath /usr/hdp/2.3.0.0-2557/hadoop/lib/azure-storage-2.2.0.jar:/usr/hdp/2.3.0.0-2557/hadoop/lib/microsoft-windowsazure-storage-sdk-0.6.0.jar:/usr/hdp/2.3.0.0-2557/hadoop/hadoop-azure-2.7.1.2.3.0.0-2557.jar

一旦你有了使用 wasb 的 spark,或者下一步是在 zeppelin 类路径中制作这些相同的 jar。测试您的设置的一个好方法是制作一个打印您的环境变量和类路径的笔记本。

sys.env.foreach(println(_))

val cl = ClassLoader.getSystemClassLoader
cl.asInstanceOf[java.net.URLClassLoader].getURLs.foreach(println)

同时查看安装脚本,它试图从 wasb 中提取 zeppelin jar,您可能希望在尝试其中一些更改时将该配置更改为其他位置。 (zeppelin.sh)

export SPARK_YARN_JAR=wasb:///apps/zeppelin/zeppelin-spark-0.5.5-SNAPSHOT.jar

我希望这会有所帮助,如果您仍有问题,我还有其他想法,但会先从这些开始。

【讨论】:

  • 感谢您的回复。我已经尝试了您的步骤,但不幸的是,我无法让它运行。我仍然遇到同样的错误。但是,问题似乎是由于教程中指出的脚本,该脚本适用于不同版本的 spark (1.5.1)。他们已经更新了脚本,现在一切正常。
猜你喜欢
  • 2017-08-24
  • 2020-11-29
  • 2017-04-16
  • 2019-10-09
  • 2018-09-19
  • 1970-01-01
  • 2017-09-13
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多