【发布时间】:2017-06-27 20:42:17
【问题描述】:
我想通过 spark 代码将前 5 行写入 hdfs 文件
sc.textFile("hdfs://localhost:8020/user/hadoop/data-master/retail_db/products/part-00000").map( rec => ( rec.split(",")(4).toDouble, rec )).sortByKey(false).map(_._2)
这里我们可以使用 saveAsTextFile API,但这是一个动作,而我们需要通过转换来限制行。
【问题讨论】:
-
我怀疑,这里已经回答了这个问题:stackoverflow.com/questions/34206508/…
标签: apache-spark