【发布时间】:2019-04-03 21:04:12
【问题描述】:
假设我在同一个目录中有多个 CSV 文件,这些文件都共享相同的架构。
/tmp/data/myfile1.csv、/tmp/data/myfile2.csv、/tmp/data.myfile3.csv、/tmp/datamyfile4.csv
我想将这些文件读入 Spark DataFrame 或 RDD,并且我希望每个文件都成为 DataFrame 的一个分区。我该怎么做?
【问题讨论】:
标签: csv apache-spark apache-spark-sql