【发布时间】:2019-01-22 16:02:01
【问题描述】:
我正在尝试将一些 CSV 文件从 Google Cloud Storage 加载到 BigQuery 中,并尝试生成架构。有一个自动生成选项,但记录不充分。问题是,如果我选择让 BigQuery 生成架构,它在猜测数据类型方面做得不错,但有时它会将数据的第一行识别为标题行,有时它不会(将第一行视为行作为数据并生成列名,如 string_field_N)。我的数据的第一行是 always 标题行。有些表有很多列(超过 30 列),我不想乱用架构语法,因为当架构出现问题(我不知道是什么)时,BigQuery 总是会用无意义的错误消息轰炸。
那么:如何强制它将第一行识别为标题行?如果这不可能,我如何让它以正确的语法吐出它生成的模式,以便我可以编辑它(对于适当的列名)并将其用作导入时的模式?
【问题讨论】:
-
你能分享一个可以更好地加载的 csv/json 样本吗?可以帮助您找到合适的答案
-
共享 CSV 文件的前几行会很有帮助,因为 BigQuery 中的架构自动检测存在故障。请参阅下面的回复。
标签: csv google-bigquery loading