【发布时间】:2016-05-25 17:32:06
【问题描述】:
我正在使用 Scala API 在 Spark 中运行序列模型。这是查看结果的代码行:
model.freqSequences.collect().foreach { freqSequence => println(freqSequence.sequence.map(_.mkString("[", ", ", "]")).mkString("[", ", ", "]") + ", " + freqSequence.freq)}
问题是结果越来越大,不想再使用 collect() 而是将其保存在 HDFS 或本地的文件中。我试过这个:
scala> val outcome = model.freqSequences.foreach { freqSequence => println(freqSequence.sequence.map(_.mkString("[", ", ", "]")).mkString("[", ", ", "]") + ", " + freqSequence.freq)}
scala> outcome.saveAsTextFile("tmp/outcome1/")
error: saveAsTextFile is not a member of Unit
结果是一个单元,我无法使用 saveAsTextFile。还有其他方法可以保存这个结果吗?发送。
【问题讨论】:
标签: java scala apache-spark