【发布时间】:2017-09-30 16:20:34
【问题描述】:
我有句子列表和单词列表,我想更新每个句子以仅保留单词列表中的单词。
比如我有以下几个字
"美国","英国","德国","澳大利亚","意大利","in","to"
以及以下句子:
“我在德国生活了 2 年”、“我从意大利搬到美国”、“美国、英国和澳大利亚的人说英语”
我想删除单词列表中未出现的句子中的所有单词 所以预期的输出是以下句子: “在德国”、“意大利到美国”、“在美国英国澳大利亚”
如何使用应用函数来做到这一点
mywords=data.frame(words=c("USA","UK","Germany","Australia","Italy","in","to"),
stringsAsFactors = F)
mysentences=data.frame(sentences=c("I lived in Germany 2 years",
"I moved from Italy to USA",
"people in USA, UK and Australia speak English"),
stringsAsFactors = F)
【问题讨论】:
-
我第一次看错了;这里有一个非常相似的问题与接受的答案 - stackoverflow.com/questions/28891130/…
-
@neilfws - 可以很容易地适应 - 例如
sapply(strsplit(sentence, "[[:space:]|[:punct:]]"), intersect, vect)。
标签: r