【发布时间】:2018-11-13 14:09:44
【问题描述】:
得到一个包含 50 个关键字的列:
Keyword1
Keyword2
Keyword3
KeywordN=50
此外,我得到了一个包含两列的数据框:标题和摘要。
Title Abstract
Rstudio Keyword1 A interesting program language keyword2
Python Keyword3 A interesting program keyword3 language
我想获得一个额外的列(我们称之为关键字),如果关键字名称出现在标题或摘要中,则会出现在该列中,如下所示:
Title Abstract Keywords
Rstudio Keyword1 A interesting program language keyword2 Keyword1, keyword2
Python Keyword2 A interesting program keyword3 language Keyword2, Keyword3
我唯一能“解决”这个问题的方法是制作一个二进制列(如果模式匹配)。 (grepl 函数),但这不是我们想要的解决方案……
【问题讨论】:
标签: r regex text preprocessor