【发布时间】:2018-09-29 05:57:30
【问题描述】:
在 SQL 中,我使用以下代码根据唯一 ID 从表中删除重复项:
1. SELECT Unique_ID INTO holdkey FROM [Origination] GROUP BY Unique_ID HAVING count(*) > 1
2. SELECT DISTINCT Origination.*
INTO holddups
FROM [Origination], holdkey
WHERE [Origination].Unique_ID = holdkey.Unique_ID
3. DELETE Origination
FROM Origination, holdkey
WHERE Origination.Unique_ID = holdkey.Unique_ID
4. INSERT Origination SELECT * FROM holddups
第二个过程不适用于 BigQuery。无论我如何更改查询,我都会收到无法识别的列和表的错误。
我显然取出“选择进入”查询并手动设置目标表。我有 SQL 经验,而且我知道该过程有效。有没有人有一个语法示例,用于根据 BQ 的唯一 ID 删除重复记录的过程?或者一种修改它以使其运行的方法?
【问题讨论】:
标签: google-bigquery