【问题标题】:How to remove content inside a div tag using gsub in R如何在 R 中使用 gsub 删除 div 标签内的内容
【发布时间】:2016-01-09 23:24:36
【问题描述】:

我如何删除 div 标签内的内容,使用 gsub 知道它可能包含应删除的其他 div。

举个例子

"<div id="body-wrapper"><div id="outer"><span>text text</span></div></div>"

gsub 函数应该只提取 div 父级

<div id="body-wrapper"></div>

【问题讨论】:

    标签: r gsub


    【解决方案1】:

    gsub 可能不是最简单或最好的方法,但可以:

    gsub('>.*$', '></div>', string)
    

    【讨论】:

      【解决方案2】:

      您还可以使用 stringr 包中的 str_extract_all 函数来提取所需的文本。

      x1<-'<div id="body-wrapper"><div id="outer"><span>text text</span></div></div>'
      y1<-unlist(str_extract_all(x1, '<div id="([^<]*)"><'))
      paste0(y1, '/div>', collapse="")
      

      输出:&lt;div id=\"body-wrapper\"&gt;&lt;/div&gt;

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2014-10-06
        • 2014-03-12
        • 2016-02-03
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多