【发布时间】:2020-06-21 14:54:09
【问题描述】:
我正在尝试创建包含以下字段的视图:日期、自定义维度 X 的值、自定义维度 Y 的值、访问者 ID、综合浏览量、内容组 A 的值、内容组 B 的值、事件类别,事件操作。
我知道这是很多领域,我很难真的想出一个解决方案。
现在,我创建了一个视图,其中包含日期、自定义维度 X 的值、自定义维度 Y 的值、访问者 ID、浏览量。
然后我创建了第二个视图,其中包含日期、访客 ID、内容组 A 的值、内容组 B 的值、事件类别、事件操作。
我在 日期 和 访客 ID 加入了这两个。
-- 下面的代码--
CREATE VIEW `TEST_1`
AS
SELECT
date AS Date,
(SELECT value FROM UNNEST(customDimensions) WHERE index=2) AS Institution_ID,
(SELECT value FROM UNNEST(customDimensions) WHERE index=3) AS Institution_Name,
fullVisitorId AS Visitor_ID,
SUM(totals.pageviews) AS Pageviews
FROM
`ga_sessions_*`
GROUP BY
date,
Visitor_ID,
Institution_ID,
Institution_Name
CREATE VIEW `TEST_2`
AS
select
DATE as DATE,
fullVisitorId AS Visitor_ID,
hits.contentGroup.contentGroup3 as Topic_Name,
hits.contentGroup.contentGroup5 as Topic_ID,
hits.eventInfo.eventCategory as Event_Category,
hits.eventInfo.eventAction as Event_Action
FROM
`ga_sessions_*`
, UNNEST (HITS) AS HITS
CREATE VIEW `TEST_3` AS
SELECT A.DATE,
A.VISITOR_ID,
Institution_ID,
Institution_Name,
Pageviews,
Topic_Name,
Topic_ID,
Event_Category,
Event_Action
FROM `TEST_1` A
JOIN `TEST_2` B ON A.DATE=B.DATE AND A.VISITOR_ID=B.VISITOR_ID
查询运行没有错误,但综合浏览量完全错误,远高于 GA 中报告的数量。我怀疑我在这里复制行的效率很低。
有人可以帮助我了解我做错了什么吗?非常感谢!
【问题讨论】:
-
请提供样本数据、期望的结果以及您想要实现的逻辑的解释。非工作查询没有此信息。
标签: sql join google-analytics google-bigquery unnest