【发布时间】:2016-10-10 12:11:54
【问题描述】:
我需要读取 pySpark 中的连续文件。以下对我有用。
from pyspark.sql import SQLContext
file = "events.parquet/exportDay=2015090[1-7]"
df = sqlContext.read.load(file)
如何读取文件 8-14?
【问题讨论】:
标签: python apache-spark pyspark pyspark-sql