【发布时间】:2018-12-10 05:19:52
【问题描述】:
有一个类似的question,但我正在寻找的输出不同。
我有一个数据框,其中列出了所有单词(列)以及它们出现在每个文档(行)中的数量。
看起来像这样:
{'orange': {0: '1',
1: '3'},
'blue': {0: '0',
1: '2'}}
输出应该以这种方式将原始文档“重新创建”为一个词袋:
corpus = [
['orange'],
['orange', 'orange', 'orange', 'blue', 'blue']]
如何做到这一点?
【问题讨论】:
标签: pandas