【发布时间】:2021-07-25 19:21:27
【问题描述】:
我需要比较 Hive 中两个表分区的数据变化。具体来说,我有两个分区(ptn_dt='01-31-2019' 和 ptn_dt='02-28-2019')。每个分区都包含以下列 - num_key 和 active_indicator(true 或 false)。
我需要确定以下内容:
到目前为止,我使用下面的 Hive SQL 查询成功地获得了按 active_indicator 分组的每个分区的计数。但是,我在尝试在分区之间进行比较时遇到了麻烦。
"""SELECT active_indicator,count(*) from table_name WHERE ptn_dt='2019-01-31' GROUP BY active_indicator"""
使用示例数据和所需结果进行编辑:
ptn_dt = '2019-01-31'
| num_key | active_indicator |
|---|---|
| 111 | true |
| 112 | false |
| 113 | false |
| 114 | false |
| 115 | true |
| 116 | true |
ptn_dt = '2019-02-28'
| num_key | active_indicator |
|---|---|
| 111 | true |
| 112 | false |
| 113 | true |
| 114 | true |
| 115 | true |
| 116 | true |
| 117 | true |
| 118 | false |
| 119 | true |
输出:
【问题讨论】:
-
请提供样本数据和期望的结果。
-
你好。我刚刚用一些示例详细信息和所需结果编辑了帖子。
-
我尝试了您分享的最新编辑,不确定,但它没有返回任何值? :( 不确定我是否错过了什么。
-
请帮忙。 @戈登林诺夫