【发布时间】:2018-07-07 14:00:12
【问题描述】:
我正在尝试通过 bash 脚本过滤掉文件中的行。我可以通过运行命令从脚本位置找到文件的路径
Fgff=`find $D -maxdepth 1 -type f -name "*.gff"`
我可以通过运行命令向找到的 .gff 文件添加一列
sed -i '1 s/$/\tsample/; 1! s/$/\t'${D##*/}'/' $Fpsi
但是,如果我尝试过滤文件并将输出写入同一文件夹中的另一个文件,则它不起作用。
grep 'ENSG00000155657\|ENSG00000198947' $Fgff > "$Fgff$filtered"
我想知道为什么 grep 不起作用?
如何在./dira/dirb/apple.gff 的文件apple.gff 中过滤所有具有子字符串ENSG00000155657 或ENSG00000198947 的行并将其存储在./dira/dirb/applefiltered.gff 中?
谢谢
【问题讨论】:
-
使用
grep -E 'ENSG00000155657|ENSG00000198947'并去掉反斜杠。-E打开扩展正则表达式(egrep模式适用于我们这些在上个千年学习 Unix 的人)。 -
一般来说,最好使用
$(…)而不是反引号来捕获命令的输出。您可能需要担心文件名中的空格和其他奇怪字符可能存在问题。 -
@JonathanLeffler 感谢 -E 并删除 / 成功了。除原始文件外,文件在同一目录中制作。在发布问题之前花了几个小时,但现在很高兴排序。