【发布时间】:2015-12-22 11:28:22
【问题描述】:
如何读取多个文件(> 1000 个文件)并说只打印出 spark 中每个文件的第一行?
我正在阅读链接 How to read multiple text files into a single RDD? 其中提到我可以使用以下语法在 spark 中读取多个文件(比如 3 个文件):
val fs = sc.textFile("a.txt,b.txt,c.txt")
但fs 似乎将所有文件粘合在一起。
【问题讨论】:
标签: scala apache-spark