【发布时间】:2021-04-10 11:04:25
【问题描述】:
我在 pandas 的一列中有以下字符串序列:
SEQ
An empty world
So the word is
So word is
No word is
我可以使用模糊模糊或余弦距离检查相似度。 但是,我想知道如何获取有关将位置从 amore 更改为另一个的单词的信息。 例如: 第一行和第二行之间的相似度为 0。但这里是第 2 行和第 3 行之间的相似度。 他们提出了几乎相同的词和相同的位置。如果可能的话,我想可视化这种变化(缺少单词)。与第 3 行和第 4 行类似。 如何查看两行/文本之间的变化?
【问题讨论】:
-
您是否有兴趣根据您的示例比较连续行或所有可能的组合?
标签: python pandas cosine-similarity fuzzywuzzy sentence-similarity