【发布时间】:2019-08-18 08:16:43
【问题描述】:
我正在尝试从 Word 文档中提取表单中的值,以便将它们制成表格。我使用 antiword 包将 .doc 转换为字符串,现在我想根据文档中的标记提取值。
例如
example<- 'CONTACT INFORMATION\r\n\r\nName: John Smith\r\n\r\nphone: XXX-XXX-XXXX\r\n\r\n'
Name<- grep('\nName:', example, value = TRUE)
Name
当我希望它只返回“John Smith”时,此代码会返回整个字符串。
有没有办法给grep() 添加一个结束标记?我也尝试过str_extract(),但我无法将我的模式格式化为正则表达式
【问题讨论】: