【发布时间】:2015-08-20 18:02:25
【问题描述】:
我有格式类似于 \t\tloc: 'Silver Spring, MD', 的字符串,我从网站中提取了这些字符串,并且只想检索城市名称和州缩写,例如Silver Spring, MD。我正在考虑将gsub 和substr 组合起来,但是城市名称可能会根据其他数据而改变,因此给substr 一个开始和结束索引是没有意义的。这是我到目前为止尝试过的代码:
# Would like to extract the string "Silver Spring, MD"
# What I tried:
ldata <- "\t\tloc: 'Silver Spring, MD',"
dt<- gsub(".*: ", "",ldata)
# Produces: 'Silver Spring, MD',"
但字符串总是以相同的方式出现,城市名称位于字符串段的“ABCDE, FG”部分。我是 R 新手,所以如果有更有效的方法可以做到这一点。
【问题讨论】: