【发布时间】:2017-12-26 05:11:30
【问题描述】:
我正在尝试了解 pandas 的工作原理,但我认为我遗漏了一些明显的东西。
我有一个像这样的文件:
dict_spl ={'doc1':[[('word11',1,1),('word12',1,2)]], 'doc2':[[('word21',2,1),('word22',2,2)]]}
我正在尝试获取一个看起来像这样的pandas DataFrame:
# doc1 word11 1 1
# doc1 word12 1 2
# doc2 word21 2 1
# doc2 word22 2 2
我还没有找到一种在复制公共值的同时创建新列和新行的方法。
【问题讨论】:
-
你是怎么把这个传给 pandas 的?
-
以
pd.DataFrame(dict_spl).T为例。除了它显然没有给出我想要的结果。我不确定它是否真的回答了你的问题。 -
你能改变你的字典结构吗?如果是这样,您可以通过以下方式创建您在上面写出的框架:
pd.DataFrame.from_records([('a','a1',1,1),('a', 'a2',1,2), ('b', 'b1',2,1),('b', 'b2',2,2)]) -
不,我不能轻易改变字典的结构。我在使用
Spacy解析存储在 DataFrame 中的几个文档时获得它,它返回给我的东西看起来像dict_spl。
标签: python pandas dictionary nested-lists