【发布时间】:2020-04-09 17:06:34
【问题描述】:
我发现下面的代码段可以使用 pyspark 读取 parquet 文件。
df = spark.read.format('parquet').option("read.partitions", "6").load(pq_loc)
但我找不到任何关于 option("read.partitions", "6") 的参考资料。这个选项有什么用?有没有什么地方可以找到所有可用的从镶木地板上阅读的选项?
【问题讨论】:
标签: apache-spark pyspark parquet