使用 SED 将捕获组替换为正则表达式模式答案

【问题标题】：Using SED to replace capture group with regex pattern使用 SED 将捕获组替换为正则表达式模式
【发布时间】：2018-12-18 14:43:43
【问题描述】：

我需要一些关于 sed 命令的帮助，我认为这有助于解决我遇到的问题。我基本上有长文本文件，看起来像这样：

>TRINITY_DN112253_co_g1_i2 Len=3873 path=[38000:0-183]
ACTCACGCCCACATAAT

ACT 文本块继续，然后有更多的文本块遵循相同的模式，除了 > 之后的文本在数字上略有不同。我只想将这个标题部分（后面跟着 > 的部分）替换为所有内容，直到最后一个“_”我认为合乎逻辑的 sed 命令如下：

sed -i ‘s/>.*/TRINITY.*_/‘

但是，sed 确实将每个标头更改为 TRINITY.*_ 而不是捕获我认为会的块。任何帮助表示赞赏！

（另外.. 只是为了说明清楚，我认为我的 sed 命令会将顶部标题块转换为：

>TRINITY_DN112253_co_g1_
ACTCACGCCCACATAAT

【问题讨论】：

【解决方案1】：

这可能会有所帮助：

sed '/^>/s/[^_]*$//' file

输出：

>TRINITY_DN112253_co_g1_ ACTCACGCCCACATAAT

【讨论】：