【发布时间】:2014-09-11 03:13:30
【问题描述】:
假设我有一个这样的数据框列表,称为 Single_Words:
Words
The
Man
Was
Funny
and
Handsome
然后是另一个像这样的单独的数据框列表,称为 Bigrams:
Words
The Comedian
The Man
Handsome Dan
Funny Guy
Man Down
The Jokester
Comedians Are
我想要做的是遍历 Single_Words 数据框中的每个单词,然后将其连接到第二个列表中的二元组,其中只有二元组的第一个单词是相同的。
所以这是一个示例输出,使用第一个数据帧中的单词“The”并遍历第二个数据帧将产生一个新列表,如下所示:
Words
The The Comedian
The The Man
The The Jokester
使用第一个数据帧中的“Man”并遍历第二个数据帧将给出:
Words
Man Down
一旦我有了这个新列表并遍历了初始列表,我计划通过再次遍历原始二元表(最多 5 次)来冲洗并重复此过程。所以回到“The”的例子,第二次迭代会像这样添加到列表中
Words
The The Comedian
The The Man
The The Jokester
The The Man Man Down
The The Comedians Comedians Are
有人有什么建议吗?
【问题讨论】:
标签: python-3.x pandas