【发布时间】:2018-09-08 03:07:23
【问题描述】:
我正在尝试在 Python 中创建嵌套字典的数据结构。我将 2 个类似 sql-table 的关系 csv 文件读入数据帧,然后将它们逐行转换为字典。在这些字典中,我存储从另一个 csv 创建的字典。
只要我将字典直接存储在 dict 键中,下面的代码就可以工作。
但我真正想要的是data[id]['ticket'] 包含一个字典列表。 (1 位客户可能拥有多张门票)
import json
import pandas as pd
import collections
# Import csv into dataframe (maybe not necessesary)
df1 = pd.read_csv('customer.csv', sep=';', header=0, dtype=object, na_filter=False)
df2 = pd.read_csv('tickets.csv', sep=';', header=0, dtype=object, na_filter=False)
df1['tickets'] = '' #create new empty column in dataframe 1
data = collections.defaultdict(dict)
# Convert initial dataframe to dictionary of dictionarys
for index, row in df1.iterrows():
row_dict = row.to_dict()
data[row_dict['id']] = row_dict
data[row_dict['id']]['tickets'] = []
# Convert each row of dataframe 2 to into dictionary and store on correct key of dict 1
for index, row in df2.iterrows():
row_dict = row.to_dict()
data[row_dict['kundenid']]['tickets'].append(row_dict)
with open('json_file', 'w') as f:
json.dump(data, f, indent=4)
使用此代码,我收到tickets 的关键错误。但是,当我使用 data[row_dict['id']]['tickets'] = row_dict 将字典附加到键 tickets 时,代码有效。我只需要这个领域的多个字典。
我最终想要实现的是一个看起来像这样的字典/JSON:
{ "1111": {
"id": "1111",
"name": "",
"adr": "",
"tickets": [{
"ticketid": "123545",
"id": "1111"
},
{
"ticketid": "123545",
"id": "1111"
}]}
....
}
如何在 tickets 键下存储字典列表?
编辑:一些示例输入数据:
tickets.csv
id;ticketid;xyz;message
1;9;1;fgsgfs
2;8;2;gdfg
3;7;3;gfsfgfg
4;6;4;fgsfdgfd
5;5;5;dgsgd
6;4;6;dfgsgdf
7;3;7;dfgdhfd
客户.csv
id;name;surname;address;XID
1;Mueller;Hans;42553;1
2;Meier;Peter;42873;2
3;Schmidt;Micha;42567;213
4;Pauli;Ulli;98790;432
5;Dick;Franz;45632;423
6;Doof;Udo;76543;233
7;Pang;Lars;43232;234
8;Peutz;Lee;11342;4234
【问题讨论】:
-
您能否从您的 csv 文件中包含一些记录?虽然有些人可能能够可视化您的代码,但像我这样的普通人需要一些帮助。
-
用一些示例数据更新了问题。希望这有助于理解我想要实现的目标。
标签: python json pandas dictionary defaultdict