【问题标题】:How to extract string between " " in R? [duplicate]如何在R中的“”之间提取字符串? [复制]
【发布时间】:2020-11-07 22:10:30
【问题描述】:

如何提取字符串“”之间的数据。

我有以下字符串数据为例:

x <- c('"Apr 21 2020 16:45        10894 <A HREF=\"D188_2020-03-30.csv\">D188_2020-03-30.csv</A>"')

想提取D188_2020-03-30.csv\ 作为输出。

参考了各种gsub 的例子,但无法弄清楚。

感谢任何建议。

【问题讨论】:

    标签: r string gsub


    【解决方案1】:

    "" 之间有多个字符串,因此您需要一些其他标识符来提取您想要的内容。也许在"HREF"之后尝试""之间的字符串。

    sub('.*HREF="(.*?)".*', '\\1', x)
    #[1] "D188_2020-03-30.csv"
    

    【讨论】:

    • 是的,试过了......完美的工作......!谢谢@Ronak..awesome...!
    【解决方案2】:

    这是使用 stringr 包中的 str_extract 函数的另一种方法。

    str_extract(string = x, pattern = ("(?<=HREF=\").*(?=.>D188)"))
    

    这基本上通过向后查找以匹配 (?&lt;=HREF=\") 并向前查找以匹配 (?=.&gt;D188)") 来返回文本。

    # [1] "D188_2020-03-30.csv"
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2020-04-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-05-08
      • 2020-12-06
      • 2021-02-21
      • 1970-01-01
      相关资源
      最近更新 更多