【问题标题】:Extract data from deeply-nested JSON从深度嵌套的 JSON 中提取数据
【发布时间】:2020-11-07 14:41:16
【问题描述】:

我是 JSON 数据的新手,我正在尝试了解一个嵌套非常深的字典,该字典位于 3 个数组和一个 JSON 文件的字典中。我正在尝试使用标签为“播放器”的字典。我正在尝试为所有团队提取球员,然后将其移动到 DataFrame 中,以便我可以用于其他分析。

如何编写循环来获取这些数据?

这是我正在尝试做的,但它不起作用:

rostered = json.dumps(rostered_players)
player_value = [[
                values['playerPoolEntry']['player']
                ]for values in rostered]

这是我正在使用的数据示例:

rostered = 
'''[
  [    
    {
    "appliedStatTotal": 260.05,
    "entries": [
        [
            {
            "injuryStatus": "NORMAL",
            "lineupSlotId": 2,
            "playerId": 2977644,
            "playerPoolEntry": {
                                "appliedStatTotal": 37.6,
                                "id": 2977644,
                                "keeperValue": 56,
                                "keeperValueFuture": 56,
                                "lineupLocked": false,
                                "onTeamId": 1,
                                "player":   {
                                            "firstName": "Todd",
                                            "fullName": "Todd Gurley II",
                                            "id": 2977644,
                                            "injuryStatus": "ACTIVE",
                                            "lastName": "Gurley II"
                                            },
            "rosterLocked": false,
            "tradeLocked": false
                                }
                }
            ]
        ]
    }
],
    [
        {
            "appliedStatTotal": 260.05,
            "entries": [
            [
                {
                "injuryStatus": "NORMAL",
                "lineupSlotId": 4,
                "playerId": 3892889,
                "playerPoolEntry": {
                                "appliedStatTotal": 6.6000000000000005,
                                "id": 3892889,
                                "keeperValue": 5,
                                "keeperValueFuture": 5,
                                "lineupLocked": false,
                                "onTeamId": 2,
                                "player":   {
                                            "defaultPositionId": 3,
                                            "firstName": "Dede",
                                            "fullName": "Dede Westbrook",
                                            "id": 3892889,
                                            "lastName": "Westbrook"
                                            },
            "rosterLocked": false,
            "tradeLocked": false
                                    }
                    }
                ]
            ]
        }
    ]
]'''

【问题讨论】:

标签: python arrays json dictionary


【解决方案1】:

一种可能的解决方案是按原样解析给定的 JSON。

rostered=json.loads(rostered)
    player_values=[]
    for level0 in rostered:
        for level1 in level0:
            if 'entries' in level1:
                level2 = level1.get('entries')
                for level3 in level2:
                    for level4 in level3:
                        if 'playerPoolEntry' in level4 and 'player' in level4.get('playerPoolEntry'):
                            player_values.append(level4.get('playerPoolEntry').get('player'))

【讨论】:

  • 我试过了,但它在输出中没有返回任何值
  • rostered=json.loads(rostered) 在运行循环之前添加这一行。我已经更正了代码。
【解决方案2】:

一种方法是使用递归。这是一种更实用的方法。

from pprint import pprint

def iterate_deep(item):
  if isinstance(item, dict):
    for key, val in item.items():
      if key == 'player':
        pprint(val)
      else:
        iterate_deep(val)
  elif isinstance(item, list):
    for deeper_item in item:
      iterate_deep(deeper_item)

iterate_deep(rostered_players)

【讨论】:

  • 你为什么要使用递归呢?如果树的其他部分还有其他 player 键怎么办?
  • @njzk2 因为递归是上下文无关的。显然,没有什么可以阻止他使用iterate_deep 来进一步深入。但我不知道他的意图。我上面的函数只是演示了 one 循环数据的方法。
猜你喜欢
  • 1970-01-01
  • 2014-11-08
  • 1970-01-01
  • 1970-01-01
  • 2012-09-16
  • 2016-04-18
  • 1970-01-01
  • 2017-04-03
  • 1970-01-01
相关资源
最近更新 更多