【发布时间】:2017-03-10 12:02:35
【问题描述】:
这与this question 非常相似,但多了一层。我正在查看一列中的字符串是否存在于另一列中。但是由于对于某些行,该列是空的,所以当我运行下面的代码时,我会得到很多“TRUE”,因为它们只匹配空格。如何忽略空格而只匹配字符?
word <- c('Hello','','nyc', '')
keywords <- c('hello goodbye nyc','hello goodbye nyc', 'hello goodbye nyc', 'hello goodbye nyc')
df <- data.frame(word, keywords, stringsAsFactors=F)
我想要的是添加一个新列 (word_exists),它告诉我列 'word' 中的字符串是否存在于 'keywords' 中。我试过了:
df$word_exists <- mapply(grepl, pattern=df$keywords, x=df$word)
但是得到所有'TRUE',我认为这是因为它识别'keywords'中的空格并将它们匹配到空'words'。有什么建议? 谢谢!
【问题讨论】: