【问题标题】:Bigquery exporting tables in GCS of file size 8GB even using single wildcard URI to export the table in less than 1 gb chunksof fileBigquery 在文件大小为 8GB 的​​ GCS 中导出表,即使使用单个通配符 URI 将表导出到小于 1 gb 的文件块中
【发布时间】:2020-04-08 08:46:47
【问题描述】:

我尝试手动使用命令行将具有 140GB 数据的大查询表导出到 GCS 存储桶中小于 1GB 的文件中。导出后总共创建了 168 个文件。从 1 到 167 的所有文件都小于 1GB,但在使用命令行或使用大查询界面导出时,最后一个文件大约为 8GB。

这是GCS存储桶的截图。

我按照Export bigquery table to GCS 将表导出到多个文件中,使用单个通配符 uri 将导出的表拆分为块。

我希望所有导出的文件都只有 1 GB 左右。有人可以帮我吗?谢谢。

【问题讨论】:

    标签: google-bigquery export google-cloud-storage gsutil


    【解决方案1】:

    你读错了文档。

    BigQuery 中没有每个文件导出配置 1GB。

    have read 的 1GB 是指您尝试导出的数据大小。

    如果您要导出超过 1 GB 的数据,则必须导出数据 到多个文件。当您将数据导出到多个文件时, 文件的大小会有所不同

    因此,这表明如果您的表大于 1GB,则必须导出到多个文件。但它不会告诉您文件会小于 1GB,它会告诉您文件大小会有所不同。

    【讨论】:

    • 但是,我同意@ascii_walker,行为很奇怪。我建议您打开支持案例以确保这是预期的行为。
    • @guillaumeblaquiere 几年前我已经这样做了,他们更正了文档页面。它现在明确指出“文件大小不同”。这是他们能做的最多了。
    猜你喜欢
    • 2018-11-18
    • 1970-01-01
    • 2015-04-04
    • 2018-12-26
    • 2012-10-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-01-28
    相关资源
    最近更新 更多