【发布时间】:2019-09-28 12:30:38
【问题描述】:
我有一个包含 233 个文档的语料库 (ecb_corpus) 和一个多词列表 (ecb_final)。我想将我的多词列表中的每个brigram和trigram替换到我的语料库中。
这是我的多词列表:
1 euro_area
2 monetary_policy
3 price_stability
4 interest_rates
5 second_question
6 medium_term
7 first_question
8 central_banks
9 inflation_expectations
10 structural_reforms
我只是设法通过使用 gsub 为一个案例做到这一点:
ecb_ready <- gsub(pattern = "interest rate", replacement= "interest_rates", ecb_corpus, ignore.case = TRUE, perl = FALSE, fixed = TRUE)
为了得到我想要的结果,在 pattern 中应该有语料库的任何单词 (ecb_corpus) 并在 replacement 我的列表中多词(ecb_final)。我一直在尝试完全不成功的循环(对 R 来说很新,不幸的是还不能这样做)。
有谁可以帮我循环一下吗?
非常感谢!
【问题讨论】:
-
我不确定我是否清楚地了解您要做什么。您能否通过包含一个竞争示例和预期输出来使这个简短而完整?
-
@RonakShah 请看下面DHW给出的答案。谢谢。