【发布时间】:2020-01-25 09:10:07
【问题描述】:
我有一个如下所示的数据集(在数据框中):
**_id** **paper_title** **references** **full_text**
1 XYZ [{'abc':'something','def':'something'},{'def':'something'},...many others] something
2 XYZ [{'abc':'something','def':'something'},{'def':'something'},...many others] something
3 XYZ [{'abc':'something'},{'def':'something'},...many others] something
预期:
**_id** **paper_title** **abc** **def** **full_text**
1 XYZ something something something
something something
.
.
(all the dic in list with respect to_id column)
2 XYZ something something something
something something
.
.
(all the dic in list with respect to_id column)
我尝试df['column_name'].apply(pd.Series).apply(pd.Series) 将列表和字典拆分为数据框的列,但没有帮助,因为它没有拆分字典。
我的数据框的第一行: df.head(1)
【问题讨论】:
-
如果您可以发布您共享的示例数据帧的
df.head().to_dict()的结果,与预期的输出相同,那么我们可以复制这个问题,谢谢 -
如果您提供的代码包含您的 DataFrame 并且有人可以插入控制台并使用该代码,那么您将很快得到答案。
-
@Karthik V 我添加了原始数据框的屏幕截图。我希望它有所帮助。
标签: python pandas dataframe machine-learning data-cleaning