【发布时间】:2017-03-09 09:08:31
【问题描述】:
我正在用 intelligi 编写一个 spark-scala 程序,我的代码基本上是从 oracle 中获取表格并将它们作为文本文件insert_df.rdd.saveAsTextFile("hdfs://path") 存储在 hdfs 中。这个方法我试过了,但是没用val script_sh = "///samplepath/file_creation_script.sh".!
但是我要对生成的文本文件进行一些转换,我为此编写了一个 shell 脚本。我不想分别运行 spark jar 文件和 .sh 文件。
如果有什么方法可以通过程序调用 shell 脚本,请告诉我。
【问题讨论】:
-
你可以试试
df.write.text("/hdfs/path")
标签: scala hadoop apache-spark intellij-idea spark-dataframe