【发布时间】:2016-08-23 00:44:33
【问题描述】:
这个简单的查询超时,有什么想法可以使用一些 BigQuery 技巧来优化它吗?
SELECT
s.typeFlight s_type, r.distance, r.price, (d.booking_token IS NULL) clicked
FROM [search.searches] s
LEFT JOIN [search.search_results] r ON r.searchid=s.searchid
LEFT JOIN [search.clicks] d ON d.booking_token=r.booking_token
WHERE s.saved_at BETWEEN TIMESTAMP('2016-03-01 00:00:00')
AND TIMESTAMP('2016-03-05 00:00:00')
查询设置
- 查询优先级批处理
- 目标表 bucket-984:search.result
- 写入偏好覆盖表格
- 允许大型结果 true
数据来自搜索引擎,因此表 clicks 很小(低于百万行),但表 searches 和 search_results 很大.该查询处理大约 5 TB 的数据。
【问题讨论】:
标签: join google-bigquery