【发布时间】:2017-01-26 17:05:14
【问题描述】:
第 9 列有多个值,用“;”分隔。我试图在选项卡限制文件的 $9 列中的“name_id”之后找到第一次出现的字符串 - 文件的第一行看起来像这样,例如。
1 NY state 3102016 3102125 . + . name_id "ENSMUSG8868"; trans_id "ENSMUST00000082908"; number "1"; id_name "Gm26206";ex_id "ENSMUSE000005";
有多个值用“;”分隔在第 9 列。我可以想出这个命令来提取最后一个“ENSMUSE000005”id
sed 's|.*"\([0-9_A-Z]\+\)".*|\1|' input.txt | head
可以用 awk 中的正则表达式来完成吗?非常感谢!
【问题讨论】:
-
是
ENSMUSG8868你想要的输出吗?