【发布时间】:2015-04-06 22:41:47
【问题描述】:
我在 Hive 中有一个表 A,其中一列 a1 包含 json。
Table A
Columns - a1
例如a1列的json有5个属性(j1,j2,j3,j4,j5)。
我需要将数据从表 A 加载到另一个表 B。
Table B
Columns - b1, b2, b3, b4, b5
从A加载数据到B的规则如下,
b1 - j1
b2 - j2
b3 - j3
b4 - a1 (entire column of A)
如何做到这一点?
并且可能需要将数据从 B 加载到另一个表 C。
Today C
Columns - c1, c2, c3
c1、c2、c3 加载了来自 B 的 b1、b2、b3 列的数据
c1 - b1
c2 - b2
c3 - b3
但可能需要将另一列 c4 添加到 C,并且 c4 必须使用 B 的 b4 列中的一个 json 属性 (j4) 加载。
c1 - b1
c2 - b2
c3 - b3
c4 - one of the json attributes from column b4 of B
这可能吗?如果有的话,能否指点一下?
任何其他解决方案也可以。我想要的只是将 JSON 存储在历史记录中,以便以后可以检索到它的属性。在上面的示例中,表 A 是一个临时表,因此是临时的。
【问题讨论】: