【发布时间】:2017-05-09 09:04:20
【问题描述】:
我有一张表叫:结果 我正在使用 BigQuery 从 GA 中选择数据
SELECT
Date,
totals.pageviews,
h.transaction.transactionId,
h.item.itemQuantity,
h.transaction.transactionRevenue,
totals.bounces,
fullvisitorid,
totals.timeOnSite,
device.browser,
device.deviceCategory,
trafficSource.source,
channelGrouping,
h.page.pagePath,
h.eventInfo.eventCategory,
device.operatingSystem
FROM
`atomic-life-148403.126959513.ga_sessions_*`,
UNNEST(hits) AS h
WHERE
_TABLE_SUFFIX BETWEEN REPLACE(CAST(DATE_ADD(CURRENT_DATE(), INTERVAL -1 YEAR) AS STRING), '-','')
AND CONCAT('intraday_', REPLACE(CAST(DATE_ADD(CURRENT_DATE(), INTERVAL 0 DAY) AS STRING), '-',''))
ORDER BY
date DESC
有一些记录重复。如何从表中删除重复记录?
【问题讨论】:
-
您确实想查找并删除行,或者只是将它们从查询结果中隐藏?如果是后者,请使用 DISTINCT。如果是前者,它会变得更复杂一些。
-
如何只选择不同的行?因为 itemquentity 和收入是分开的
标签: sql google-bigquery