【问题标题】:BigQuery export data in one big fileBigQuery 将数据导出到一个大文件中
【发布时间】:2019-06-28 03:10:16
【问题描述】:

BigQuery docs 告诉我们每个请求的限制,一个文件不能超过 1 Gb,这是真的,但并非总是如此。我做了一个新的导出,很惊讶,一个文件有 6 Gb 大小。而且这个大文件对我来说是个问题。

我可以做些什么来减小文件大小以及为什么 BigQuery 会做这么大的文件?

【问题讨论】:

  • 嗨@Artem,您能告诉我们您是如何进行导出的吗?在链接中,您提供的状态是:当您将数据导出到多个文件时,文件的大小会有所不同。,也许这就是您的问题的根源。
  • @TamirKlein 我尝试了几种方法,第一个是 Google API,第二个 UI,两个结果是相同的。是的,文件的大小可以不同,但​​不能超过 1Gb。该文件包含 4M 有效 JSON 行
  • 您是否尝试过使用wildcard
  • @PolOrtiz 是的,当然,这不是我第一次从 BigQuery 导出,我每天导出很多表,而且一切正常,我只有一张表有问题跨度>

标签: google-bigquery google-cloud-storage


【解决方案1】:

BigQuery 导出文件的大小各不相同,有时会拆分成一个超过 1GB 的文件或拆分成许多小文件。

有一个public issue 提交了关于此问题,但它只涉及文档更改以设置对不同导出文件大小的期望

这似乎其他人也遇到了这个问题:

您可以尝试进行新的导出,但如果导出文件的大小始终高于 1GB,您现在可以report for a public issue 审查这种不可预测的行为。

【讨论】:

    猜你喜欢
    • 2015-04-04
    • 2023-04-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-03-27
    • 2018-01-26
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多