【发布时间】:2020-11-20 01:24:43
【问题描述】:
我有一些数据,其中包含一个样本,我想将其转换为 python 和/或 json 格式的字典
您会看到 ID 重复。换句话说,每个 ID 每 15 分钟有一个时间戳值
我正在尝试创建一个嵌套字典,该字典将使用 ID 作为键,使用日期时间/流对作为每个键的值
ID datetime flow
762972 01/01/2017 00:00 -1
763753 01/01/2017 00:00 6.00E-05
763776 01/01/2017 00:00 -1
769472 01/01/2017 00:00 0.00132
793144 01/01/2017 00:00 0
799864 01/01/2017 00:00 0
812926 01/01/2017 00:00 0.00108
821553 01/01/2017 00:00 0
829800 01/01/2017 00:00 -1
830174 01/01/2017 00:00 0
762972 01/01/2017 00:15 -1
763753 01/01/2017 00:15 6.00E-05
763776 01/01/2017 00:15 -1
769472 01/01/2017 00:15 0.00048
793144 01/01/2017 00:15 0
799864 01/01/2017 00:15 6.00E-05
812926 01/01/2017 00:15 0.00024
821553 01/01/2017 00:15 0.00012
829800 01/01/2017 00:15 -1
830174 01/01/2017 00:15 0
762972 01/01/2017 00:30 -1
763753 01/01/2017 00:30 6.00E-05
763776 01/01/2017 00:30 -1
769472 01/01/2017 00:30 0.0006
793144 01/01/2017 00:30 0
799864 01/01/2017 00:30 0
812926 01/01/2017 00:30 0
821553 01/01/2017 00:30 0
829800 01/01/2017 00:30 -1
830174 01/01/2017 00:30 0
我正在尝试采用这种格式,我相信每个 ID 都会将与之关联的每个日期时间/流记录存储在嵌套字典中
任何人都可以提供任何建议。我一直在尝试先对 ID 上的原始 .csv 进行排序,然后使用 groupby 函数,但到目前为止没有成功
谢谢
nested_dict = { '762972': [{'datetime': '01/01/2017 00:00', 'flow': '-1'}, {'datetime': '01/01/2017 00:15', 'flow': '-1'}, {'datetime': '01/01/2017 00:30', 'flow': '-1'}],
'763753': [{'datetime': '01/01/2017 00:00', 'flow': '6.00E-05'}, {'datetime': '01/01/2017 00:15', 'flow': '6.00E-05'}, {'datetime': '01/01/2017 00:30', 'flow': '6.00E-05'}]
}
【问题讨论】:
标签: python json csv dictionary pandas-groupby