【发布时间】:2016-02-12 12:52:35
【问题描述】:
如何读取条件为数据框的分区拼花,
这很好用,
val dataframe = sqlContext.read.parquet("file:///home/msoproj/dev_data/dev_output/aln/partitions/data=jDD/year=2015/month=10/day=25/*")
有day=1 to day=30 的分区是否可以读取(day = 5 to 6) 或day=5,day=6 之类的内容,
val dataframe = sqlContext.read.parquet("file:///home/msoproj/dev_data/dev_output/aln/partitions/data=jDD/year=2015/month=10/day=??/*")
如果我输入*,它会给我所有 30 天的数据,而且它太大了。
【问题讨论】:
标签: scala apache-spark parquet spark-dataframe