【发布时间】:2020-01-13 23:32:51
【问题描述】:
我有一个包含许多重复行的表 - 但我只想一次删除一个分区的重复数据。
我该怎么做?
例如,您可以从一个按日期分区并填充从 1 到 5 的随机整数的表开始:
CREATE OR REPLACE TABLE `temp.many_random`
PARTITION BY d
AS
SELECT DATE('2018-10-01') d, fhoffa.x.random_int(0,5) random_int
FROM UNNEST(GENERATE_ARRAY(1, 100))
UNION ALL
SELECT CURRENT_DATE() d, fhoffa.x.random_int(0,5) random_int
FROM UNNEST(GENERATE_ARRAY(1, 100))
【问题讨论】:
标签: sql merge google-bigquery duplicates database-partitioning