【发布时间】:2020-02-26 11:28:27
【问题描述】:
我的数据是这种格式
[{"field1":"data1","field2":100,"field3":"more data1","field4":123.001}]
[{"field1":"data2","field2":200,"field3":"more data2","field4":123.002}]
[{"field1":"data3","field2":300,"field3":"more data3","field4":123.003}]
[{"field1":"data4","field2":400,"field3":"more data4","field4":123.004}]
(每一行都是一个只有一个对象的数组),我想围绕它创建一个配置单元表。
如果 json 周围没有 [],那么我可以轻松使用默认 json serde ROW FORMAT SERDE
'org.apache.hive.hcatalog.data.JsonSerDe'。
regex serde 的问题是字段的顺序会发生变化,而且很难提取出准确的值。
如何创建具有这种数据格式的配置单元表?
【问题讨论】:
标签: hadoop hive hive-serde