【发布时间】:2017-07-13 13:53:50
【问题描述】:
在 hadoop 上使用 SQL。
我有一个 ID 列表,我试图在其中计算 2 种不同的客人评论数据点的总数。对于guest_review_1,我已退回总数。对于guest_review_2,我将总数分为 5 个范围。
我正在努力的是在 guest_review_1 的 where 子句中设置一个过滤器,其中我不包括总数少于 5 个的属性。
任何解决方法的想法?嵌套的 Select 语句可能吗?
包含以下查询示例:
Select
id,
count(distinct guest_review_1) as "Guest_Reviews",
count(distinct(case when guest_review_2 < 1 then guest_review_1 end)) as Group1,
Count(distinct(case when guest_review_2 >=2 AND guest_review_2 <3 then guest_review_1 end)) as Group2,
From table_name
Where
guest_review_2 IS NOT NULL
AND guest_review_1 >=5
AND date BETWEEN '2017-01-01' AND '2017-01-31'
Group By id
【问题讨论】:
标签: sql hadoop where-clause