【发布时间】:2018-12-21 23:53:48
【问题描述】:
我想用一个有点过于复杂的数据集来实现机器学习。我想和熊猫一起工作,然后使用一些内置的模型在skit-learn中。
数据在 JSON 文件中给出,示例如下所示:
{
"demo_Profile": {
"sex": "male",
"age": 98,
"height": 160,
"weight": 139,
"bmi": 5,
"someinfo1": [
"some_more_info1"
],
"someinfo2": [
"some_more_inf2"
],
"someinfo3": [
"some_more_info3"
],
},
"event": {
"info_personal": {
"info1": 219.59,
"info2": 129.18,
"info3": 41.15,
"info4": 94.19,
},
"symptoms": [
{
"name": "name1",
"socrates": {
"associations": [
"associations1"
],
"onsetType": "onsetType1",
"timeCourse": "timeCourse1"
}
},
{
"name": "name2",
"socrates": {
"timeCourse": "timeCourse2"
}
},
{
"name": "name3",
"socrates": {
"onsetType": "onsetType2"
}
},
{
"name": "name4",
"socrates": {
"onsetType": "onsetType3"
}
},
{
"name": "name5",
"socrates": {
"associations": [
"associations2"
]
}
}
],
"labs": [
{
"name": "name1 ",
"value": "valuelab"
}
]
}
}
我想创建一个考虑这种“嵌套数据”的熊猫数据框,但我不知道如何构建一个除了“单个参数”之外还考虑“嵌套参数”的数据框
例如,我不知道如何将包含“单个参数”的“demo_Profile”与症状合并,症状是字典列表,在相同情况下为单个值,在其他情况下为列表。
有人知道解决这个问题的方法吗?
编辑*********
上面显示的 JSON 只是一个示例,在其他情况下,列表中的值的数量以及症状的数量会有所不同。因此,上面显示的示例并不适用于所有情况。
【问题讨论】:
标签: python json pandas nested structure