【问题标题】:R sort list of files numerically [duplicate]R数字排序文件列表[重复]
【发布时间】:2015-06-26 07:31:51
【问题描述】:

我有一个需要按数字排序的文件列表,以便我可以按顺序导入它们

我的代码是:

bed = '/files/coverage_v2'

beds=list.files(path=bed, pattern='ctcf.motif.minus[0-9]+.bed.IGTB950.bed')
for(b in beds){
`for(b in beds){`print(b)

  read.table(b)

}

> [1] "ctcf.motif.minus1.bed.IGTB950.bed"   "ctcf.motif.minus10.bed.IGTB950.bed" 
 [3] "ctcf.motif.minus100.bed.IGTB950.bed" "ctcf.motif.minus101.bed.IGTB950.bed"
 [5] "ctcf.motif.minus102.bed.IGTB950.bed" "ctcf.motif.minus103.bed.IGTB950.bed"
 [7] "ctcf.motif.minus104.bed.IGTB950.bed" "ctcf.motif.minus105.bed.IGTB950.bed"
 [9] "ctcf.motif.minus106.bed.IGTB950.bed" "ctcf.motif.minus107.bed.IGTB950.bed"
[11] "ctcf.motif.minus108.bed.IGTB950.bed" "ctcf.motif.minus109.bed.IGTB950.bed"
[13] "ctcf.motif.minus11.bed.IGTB950.bed"  "ctcf.motif.minus110.bed.IGTB950.bed"
[15] "ctcf.motif.minus111.bed.IGTB950.bed" "ctcf.motif.minus112.bed.IGTB950.bed"
[17] "ctcf.motif.minus113.bed.IGTB950.bed" "ctcf.motif.minus114.bed.IGTB950.bed"
[19] "ctcf.motif.minus115.bed.IGTB950.bed" "ctcf.motif.minus116.bed.IGTB950.bed"
[21] "ctcf.motif.minus117.bed.IGTB950.bed" "ctcf.motif.minus118.bed.IGTB950.bed"
[23] "ctcf.motif.minus119.bed.IGTB950.bed" "ctcf.motif.minus12.bed.IGTB950.bed" 
[25] "ctcf.motif.minus120.bed.IGTB950.bed" "ctcf.motif.minus121.bed.IGTB950.bed"
[27] "ctcf.motif.minus122.bed.IGTB950.bed" "ctcf.motif.minus123.bed.IGTB950.bed"
[29] "ctcf.motif.minus124.bed.IGTB950.bed" "ctcf.motif.minus125.bed.IGTB950.bed"
[31] "ctcf.motif.minus126.bed.IGTB950.bed" "ctcf.motif.minus127.bed.IGTB950.bed"
[33] "ctcf.motif.minus128.bed.IGTB950.bed" "ctcf.motif.minus129.bed.IGTB950.bed"
[35] "ctcf.motif.minus13.bed.IGTB950.bed"  "ctcf.motif.minus130.bed.IGTB950.bed"
[37] "ctcf.motif.minus131.bed.IGTB950.bed" "ctcf.motif.minus132.bed.IGTB950.bed"
[39] "ctcf.motif.minus133.bed.IGTB950.bed" "ctcf.motif.minus134.bed.IGTB950.bed"

但我真正想要的是按数字排序:

> "ctcf.motif.minus1.bed.IGTB950.bed" 
"ctcf.motif.minus10.bed.IGTB950.bed" 
"ctcf.motif.minus11.bed.IGTB950.bed"
"ctcf.motif.minus12.bed.IGTB950.bed" 
"ctcf.motif.minus13.bed.IGTB950.bed"
"ctcf.motif.minus100.bed.IGTB950.bed"
"ctcf.motif.minus101.bed.IGTB950.bed"

等,以便以数字形式导入。

提前致谢!!

【问题讨论】:

    标签: r sorting numeric


    【解决方案1】:

    你可以试试 mixedsortgtools

    library(gtools)
    beds1 <- mixedsort(beds)
    head(beds1)
    #[1]"ctcf.motif.minus1.bed.IGTB950.bed"   "ctcf.motif.minus10.bed.IGTB950.bed" 
    #[3]"ctcf.motif.minus11.bed.IGTB950.bed"  "ctcf.motif.minus12.bed.IGTB950.bed" 
    #[5]"ctcf.motif.minus13.bed.IGTB950.bed"  "ctcf.motif.minus100.bed.IGTB950.bed"
    

    或者使用regex(假设顺序取决于'minus'之后和'bed'之前的数字。

    beds[order(as.numeric(gsub('\\D+|\\.bed.*', '', beds)))]
    

    【讨论】:

      猜你喜欢
      • 2023-03-20
      • 2019-09-26
      • 2018-11-27
      • 1970-01-01
      • 1970-01-01
      • 2016-03-06
      • 2019-09-18
      • 2011-01-07
      • 1970-01-01
      相关资源
      最近更新 更多