【问题标题】:"resourcesExceeded" error when creating a table from a .avro file in BigQuery从 BigQuery 中的 .avro 文件创建表时出现“resourcesExceeded”错误
【发布时间】:2016-07-20 11:35:37
【问题描述】:

我在 Google Cloud Storage 上上传了一个 .avro 文件,大小约为 100MB。它是从一个 800MB 的 .csv 文件转换而来的。

尝试在 BigQuery 网络界面中从此文件创建表时,几秒钟后我收到以下错误:

script: Resources exceeded during query execution: UDF out of memory. (error code: resourcesExceeded)
Job ID  audiboxes:bquijob_4462680b_15607de51b9

我检查了BigQuery Quota Policy,我认为我的文件没有超过它。

是否有解决方法或者我需要拆分我的原始 .csv 以获得多个更小的 .avro 文件?

提前致谢!

【问题讨论】:

    标签: csv google-bigquery google-cloud-storage avro


    【解决方案1】:

    这个错误意味着解析器使用的内存超出了允许的范围。我们正在努力解决这个问题。同时,如果您在 Avro 文件中使用了压缩,请尝试将其删除。使用较小的数据块大小也会有所帮助。

    是的,拆分成较小的 Avro 文件(如 10MB 或更小)也会有所帮助,但如果上述两种方法适合您,它们会更容易。

    【讨论】:

    • 你好,这就是它在此期间所做的,我发现当 Avro 源文件大于〜35MB 时,表创建过程会失败,所以我将我的数据加载程序拆分并加载每 30MB,就像一个魅力 :) 感谢您的帮助
    猜你喜欢
    • 1970-01-01
    • 2017-11-10
    • 1970-01-01
    • 1970-01-01
    • 2022-06-14
    • 1970-01-01
    • 1970-01-01
    • 2015-07-07
    • 1970-01-01
    相关资源
    最近更新 更多