【发布时间】:2013-10-23 16:41:42
【问题描述】:
我刚开始学习使用命令行。希望这不是一个转储问题。
我的目录中有以下文件:
L001_R1_001.fastq
L002_R2_001.fastq
L004_R1_001.fastq
L005_R2_001.fastq
L001_R2_001.fastq
L003_R1_001.fastq
L004_R2_001.fastq
L006_R1_001.fastq
L002_R1_001.fastq
L003_R2_001.fastq
L005_R1_001.fastq
L006_R2_001.fastq
从文件名中可以看出,它是R1和R2的混合,L00后面的数字没有排序。
我想按文件名顺序连接文件,分别用于 R1 和 R2 文件。
如果我手动执行,它将如下所示:
# for R1 files
cat L001_R1_001.fastq L002_R1_001.fastq L003_R1_001.fastq L004_R1_001.fastq L005_R1_001.fastq L006_R1_001.fastq > R1.fastq
# for R2 files
cat L001_R2_001.fastq L002_R2_001.fastq L003_R2_001.fastq L004_R2_001.fastq L005_R2_001.fastq L006_R2_001.fastq > R2.fastq
你能帮我写一个我以后可以重复使用的脚本吗? 谢谢!
【问题讨论】:
-
嗯,你的 shell 的
glob有顺序吗?因为你可以使用cat *_R1_*.fastq > R1.fastq然后......