【发布时间】:2022-01-20 23:05:02
【问题描述】:
我有一个按 YEAR/MONTH/DAY 分区的 parquet 文件。
据我所知,我可以在特定日期以这种方式阅读它:
sqlContext
.read
.option("basePath", "file:///path/")
.parquet("file:///path/YEAR=2015/MONTH=10/DAY=5/")
但是我怎样才能得到从开始日期到结束日期的所有分区呢?
谢谢,
【问题讨论】:
标签: apache-spark pyspark parquet