【发布时间】:2018-03-11 07:44:59
【问题描述】:
我正在尝试从 R (v3.4.1) 中的字符串中提取纬度、经度和标签。我的想法是正则表达式是要走的路,并且由于 stringr 包具有提取捕获组的能力,我认为这是要使用的包。问题是我收到了一个我无法解释的错误。任何帮助,将不胜感激。
这是我想从中提取信息的字符串示例。我想获取最后一组纬度(41.505)和经度(-81.608333)以及标签(Adelbert Hall)。
a <- "Case Western Reserve University campus41°30′18″N 81°36′30″W / 41.505°N 81.608333°W / 41.505; -81.608333 (Adelbert Hall)"
这是我为获取感兴趣的字段而创建的正则表达式。
coordRegEx <- "([\\d]*\\.\\d*)(?#Capture Latitude);\\h(-\\d*\\.\\d*)(?#Capture Longitude)\\N*\\((\\N*)(?#Capture Label)\\)"
现在,当我尝试匹配字符串中的正则表达式时:
s <- str_match(a,coordRegEx)
我收到以下错误:
stri_match_first_regex(string, pattern, opts_regex = opts(pattern)) 中的错误:Unicode 属性不正确。 (U_REGEX_PROPERTY_SYNTAX)
我的猜测是这个错误与正则表达式模式有关,但使用文档和网络搜索,我一直无法破译它。
【问题讨论】: