我会使用defaultdict 来执行此操作,它会生成defaultdict(list) 实例作为默认值。
演示
>>> from collections import defaultdict
>>>
>>> d = defaultdict(lambda: defaultdict(list))
>>> data = [('schema1', 'table1', 'column_name1'), ('schema1', 'table1', 'column_name2'), ('schema1', 'table2', 'column_name3'), ('schema2', 'table3', 'column_name4')]
>>>
>>> for k1, k2, v in data:
...: d[k1][k2].append(v)
...:
>>> d
>>>
defaultdict(<function __main__.<lambda>()>,
{'schema1': defaultdict(list,
{'table1': ['column_name1', 'column_name2'],
'table2': ['column_name3']}),
'schema2': defaultdict(list, {'table3': ['column_name4']})})
要完全匹配您想要的输出(尽管我看不出太多原因),请从 d 和 tuple 值构建一个常规字典。
>>> d = {k1:{k2:tuple(v2) for k2, v2 in v1.items()} for k1, v1 in d.items()}
>>> d
>>>
{'schema1': {'table1': ('column_name1', 'column_name2'),
'table2': ('column_name3',)},
'schema2': {'table3': ('column_name4',)}}
说明
defaultdict 初始值设定项接受一个可调用对象(在此示例中使用匿名 lambda 函数)。每当缺少键时,都会调用该可调用对象并将返回值用作备用值。
线
d = defaultdict(lambda: defaultdict(list))
正在创建一个defaultdict,它会在缺少密钥时创建另一个defaultdict。第二个 defaultdict 在缺少键时创建list。
>>> d = defaultdict(lambda: defaultdict(list))
>>> d['bogus']
>>> defaultdict(list, {})
>>> d['hokus']['pokus']
>>> []