【发布时间】:2018-05-23 15:02:24
【问题描述】:
我正在尝试使用 Python 在 AWS Glue 中取消嵌套 JSON 数组数组
示例数据结构如下:
{
"country": "US",
"states": [
{
"stateId": -8727116505311523857,
"events": [
{
"eventId": 9087712927864446976,
"name": "exampleName1",
"time": 1.515376892153E9,
"value": 0.0,
"parameters": {
"exampleparam1": "27"
}
},
{
"eventId": 7885892179028651008,
"name": "exampleName2",
"time": 1.515376892154E9,
"value": 0.0,
"parameters": {
"exampleparam1": "0",
"exampleparam2": "18",
"exampleparam3": "21303",
"exampleparam4": "27",
"exampleparam5": "2",
"exampleparam6": "2",
"exampleparam7": "3",
"exampleparam8": "18",
"exampleparam9": "1",
"exampleparam10": "12"
}
}
]
}
],
"duration": 1853.938
}
我理想的结果是把每一行json拆分成多行,每一行包含所有的顶级数据,但是events数组中只有一个事件。
由于多层嵌套,unnest() 似乎不会有预期的效果。
提前感谢您的帮助。
【问题讨论】:
标签: python arrays etl aws-glue