【发布时间】:2016-01-09 23:24:36
【问题描述】:
我如何删除 div 标签内的内容,使用 gsub 知道它可能包含应删除的其他 div。
举个例子
"<div id="body-wrapper"><div id="outer"><span>text text</span></div></div>"
gsub 函数应该只提取 div 父级
<div id="body-wrapper"></div>
【问题讨论】:
我如何删除 div 标签内的内容,使用 gsub 知道它可能包含应删除的其他 div。
举个例子
"<div id="body-wrapper"><div id="outer"><span>text text</span></div></div>"
gsub 函数应该只提取 div 父级
<div id="body-wrapper"></div>
【问题讨论】:
gsub 可能不是最简单或最好的方法,但可以:
gsub('>.*$', '></div>', string)
【讨论】:
您还可以使用 stringr 包中的 str_extract_all 函数来提取所需的文本。
x1<-'<div id="body-wrapper"><div id="outer"><span>text text</span></div></div>'
y1<-unlist(str_extract_all(x1, '<div id="([^<]*)"><'))
paste0(y1, '/div>', collapse="")
输出:<div id=\"body-wrapper\"></div>
【讨论】: