【发布时间】:2019-04-13 11:50:02
【问题描述】:
我有一个如下形式的数据框:
Column1 = c('Elephant,Starship Enterprise,Cat','Random word','Word','Some more words, Even more words')
Column2=c('Rat,Starship Enterprise,Elephant','Ocean','No','more')
d1 = data.frame(Column1,Column2)
我要做的是查找并计算第 1 列和第 2 列中单词的完全匹配。每列可以有多个单词,用逗号分隔。
例如在第 1 行,我们看到有两个常用词 a) Starship Enterprise 和 b) Elephant。但是,在第 4 行中,即使在两列中都出现了单词 "more",但不会出现确切的字符串(Some more words 和 Even more words)。预期的输出将是这样的。
任何帮助将不胜感激。
【问题讨论】:
标签: r string-matching data-manipulation