【发布时间】:2018-03-20 23:25:22
【问题描述】:
gcloud-sdk 命令“bq load”可以将本地文件作为输入。
从命令的输出来看,该文件似乎是在安排 bigquery 加载作业之前首先上传到谷歌云存储某处。鉴于 bigquery schedule-load-job 端点的 REST api 也只需要“gs://”url,并且加载作业需要数据是 可访问的,我很确定这样正在上传到云存储(尽管我找不到任何明确描述本地文件“bq load”的文档。
那么我的问题是:谁能告诉我本地文件临时上传到哪里?它是 gcloud 项目云存储桶之一,还是其他地方?是否保证在加载作业完成后被删除?
我要求数据仅保存在特定地理区域,因此(假定的)临时存储的位置很重要。
我可以将数据显式上传到存储,然后参考云存储使用“bq load”,但之后需要安排删除数据,这有点不便。具有“生命周期规则”的专用存储至少可以在 1 天后删除,但“bq load ..localfile”方法更清洁..
【问题讨论】:
标签: google-cloud-platform google-bigquery google-cloud-storage