【问题标题】:What is the use of read.partitions optin when read parquetread parquet 时 read.partitions optin 有什么用
【发布时间】:2020-04-09 17:06:34
【问题描述】:

我发现下面的代码段可以使用 pyspark 读取 parquet 文件。

df = spark.read.format('parquet').option("read.partitions", "6").load(pq_loc)

但我找不到任何关于 option("read.partitions", "6") 的参考资料。这个选项有什么用?有没有什么地方可以找到所有可用的从镶木地板上阅读的选项?

【问题讨论】:

    标签: apache-spark pyspark parquet


    【解决方案1】:

    您可以参考下面的文档使用 pyspark 读取parquet 文件。

    https://spark.apache.org/docs/latest/sql-data-sources-parquet.html

    option一般用于具体说明你要如何读取文件,这里"read.partitions", "6"表示你要分6个部分读取文件。

    【讨论】:

      猜你喜欢
      • 2016-06-22
      • 1970-01-01
      • 2016-07-18
      • 2010-10-09
      • 1970-01-01
      • 2020-06-22
      • 2019-07-05
      • 2011-04-10
      相关资源
      最近更新 更多