【发布时间】:2016-05-25 12:54:41
【问题描述】:
我正在使用 bq 命令行并尝试每天用一张表插入大量 json 文件。
我的做法:
- 列出所有要推送的文件(日期名为 YYYMMDDHHMM.meta1.meta2.json)
- 在同一天文件中连接 => YYYMMDD.ndjson
- 拆分 YYYMMDD.ndjson 文件(每个 500 行文件)YYYMMDD.ndjson_splittedij
遍历 YYYMMDD.ndjson_splittedij 并运行
bq insert --template_suffix=20160331 --dataset_id=MYDATASET TEMPLATE YYYMMDD.ndjson_splittedij
这种方法有效。我只是想知道是否可以改进它。
【问题讨论】:
标签: google-bigquery