【发布时间】:2020-03-30 18:00:49
【问题描述】:
我正在尝试使用--autodetect 将 JSON 上传到 BigQuery,因此我不必手动发现和写出整个架构。 JSON 的行并不都具有相同的形式,因此在后面的行中引入了字段,而在前面的行中没有。
不幸的是,我遇到了以下失败:
Upload complete.
Waiting on bqjob_r1aa6e3302cfc399a_000001712c8ea62b_1 ... (1s) Current status: DONE
BigQuery error in load operation: Error processing job '[...]:bqjob_r1aa6e3302cfc399a_000001712c8ea62b_1': Error while reading data, error message: JSON table encountered too many errors, giving up.
Rows: 1209; errors: 1. Please look into the errors[] collection for more details.
Failure details:
- Error while reading data, error message: JSON processing
encountered too many errors, giving up. Rows: 1209; errors: 1; max
bad: 0; error percent: 0
- Error while reading data, error message: JSON parsing error in row
starting at position 829980: No such field:
mc.marketDefinition.settledTime.
这是我要上传的数据:https://gist.github.com/max-sixty/c717e700a2774ba92547c7585b2b21e3
也许自动检测使用前 n 行,然后如果 n 之后的行不同则失败?如果是这样的话,有什么办法可以解决这个问题吗?
我可以使用任何工具从整个文件中提取架构,然后显式传递给 BigQuery?
【问题讨论】:
标签: google-bigquery