【发布时间】:2020-03-31 10:30:32
【问题描述】:
我想使用 kwic() 在文本中查找具有更高级正则表达式短语的模式,但我正在努力解决 kwic() 标记短语的方式,并且出现了两个问题:
1) 如何使用包含空格的短语进行分组:
kwic(text, pattern = phrase("\\b(address|g[eo]t? into|gotten into)\\b \\bno\\b"), valuetype="regex")
stri_detect_regex(types_search, pattern, case_insensitive = case_insensitive) 中的错误: 正则表达式模式中不正确的嵌套括号。 (U_REGEX_MISMATCHED_PAREN)
2)如何查找更长的单词序列(与第一个问题类似):
kwic("this is a test", pattern= phrase("(\\w+\\s){1,3}"), valuetype="regex", remove_separator=FALSE)
0 行的 kwic 对象
kwic("this is a test", pattern= phrase("(\\w+ ){0,2}"), valuetype="regex", remove_separator=FALSE)
stri_detect_regex(types_search, pattern, case_insensitive = case_insensitive) 中的错误: 正则表达式模式中不正确的嵌套括号。 (U_REGEX_MISMATCHED_PAREN)
感谢您的任何提示!
【问题讨论】: