【问题标题】:How to extract the last text after forward slash如何提取正斜杠后的最后一个文本
【发布时间】:2022-06-23 01:23:58
【问题描述】:

我有一个看起来像这样的 df:

AF GT Sample_name
0.001 1/1 path/to/sample/name/ID0001.vcf.gz
0.005 0/1 path/to/sample/name/ID0002.vcf.gz

我想要的只是将 ID 名称保留在 Sample_name 列中:

AF GT Sample_name
0.001 1/1 ID0001
0.005 0/1 ID0002

我非常感谢任何帮助实现这一目标。

【问题讨论】:

    标签: r


    【解决方案1】:

    您可以使用带有gsub() 的正则表达式模式:

    gsub(".*(ID\\d*).*", replacement = "\\1", x = "path/to/sample/name/ID0001.vcf.gz")
    #> "ID0001"
    

    整个数据框:

    df$sample_name2 <- gsub(".*(ID\\d*).*", replacement = "\\1", x = df$sample_name)
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2017-10-10
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多