【发布时间】:2016-07-21 19:42:59
【问题描述】:
我使用下面的 Python 脚本执行查询,表格中填充了 2,564,691 行。当我使用 Google Big Query 控制台运行相同的查询时,它返回 17,379,353 行(查询原样)。我想知道下面的脚本是否有问题。不确定 bq 查询中的 --replace 是否替换过去的结果集而不是附加到它。
任何帮助将不胜感激。
dateToday = (time.strftime("%Y/%m/%d"))
dateToday1 = dateToday.replace('/','')
commandStr = "type C:\Users\query.txt | bq query --allow_large_results --replace --destination_table table:dataset1_%s -n 1" %(dateToday1)
【问题讨论】:
-
如果您愿意共享这两个作业的作业 ID,我们(BigQuery 团队)可以进一步调查,看看这两个查询之间可能有什么不同。
-
通过 Web UI 运行的查询的作业 ID:red-road-574:bquijob_64bd407c_1560f071d85
-
能否通过命令行分享查询的ID?
-
@DannyKitt:通过命令行查询的作业 id 是 bqjob_r5790ceea_000001560fdd5e9b_1
-
我查看了您的工作详情:这两个查询并不完全相同。两个查询的结构相同,但 bqjob_r5790ceea_000001560fdd5e9b_1 通过
CURRENT_TIMESTAMP引用 20160721 表(因为它在 20160721 上运行),而 red-road-574:bquijob_64bd407c_1560f071d85 显式引用 20160719 表。
标签: command-line google-bigquery