【发布时间】:2019-06-26 05:07:38
【问题描述】:
我有一个场景,从具有 parent_node_id 和 child_node_id 的层次结构表中找到最低级别的子节点,如下所示。 源表在 Hive 和 Impala 数据库中。 请建议 hive/impala 查询以找出源表中每个父节点的最低级别子节点。
我尝试在 Impala 中使用 CTE 递归查询,但我猜它不受支持。
提前感谢您!
源表:
+-------------+--------------+
|child_node_id|parent_node_id|
+-------------+--------------+
| C1 | P1 |
+-------------+--------------+
| C2 | P2 |
+-------------+--------------+
| C11 | C1 |
+-------------+--------------+
| C12 | C11 |
+-------------+--------------+
| 123 | C12 |
+-------------+--------------+
预期输出:
+-------------+--------------+
|parent_node |lowest_l_child|
+-------------+--------------+
| P1 | 123 |
+-------------+--------------+
| P2 | C2 |
+-------------+--------------+
| C1 | 123 |
+-------------+--------------+
| C11 | 123 |
+-------------+--------------+
| C12 | 123 |
+-------------+--------------+
【问题讨论】:
-
@gobrewers14 - 请帮助解决这个问题。