【发布时间】:2015-09-03 11:30:31
【问题描述】:
我正在尝试将 fastq 文件中的所有坐标信息更改为零。我的输入文件由以下重复的 4 行结构中的数百万个条目组成:
@HWI-SV007:140:C173GACXX:6:2215:16030:89299 1:N:0:CAGATC
GATTACAGATTACAGATTACAGATTACAGATTACAGATTACAGATTACAGATTACAG
+
@@@FFFDFHGGDHIIHGIJJJJJJJJJJJGIJJJJJJJIIIDHGHIGIJJIIIJJIJ
我想以通用方式将第一行 16030:89299 中的两个数字字符串替换为零,这样冒号之间、空格之前的任何数字字符串都会被替换。我希望输出如下所示,将整个文件中的两个字符串全局替换为零:
@HWI-SV007:140:C173GACXX:6:2215:0:0 1:N:0:CAGATC
GATTACAGATTACAGATTACAGATTACAGATTACAGATTACAGATTACAGATTACAG
+
@@@FFFDFHGGDHIIHGIJJJJJJJJJJJGIJJJJJJJIIIDHGHIGIJJIIIJJIJ
我正在尝试使用以下 sed:
sed 's/:^[0-9]+$:^[0-9]+$\s/:0:0 /g'
但是,这并不像预期的那样。
【问题讨论】:
-
我不知道 SED,但
^不意味着字符串的开头吗?同样$结束?再次不知道 SED 我想你会想要:[0-9]+?: -
一定要sed吗?