【发布时间】:2013-11-06 22:14:38
【问题描述】:
我有一个包含三列的制表符分隔文件(摘录):
AC147602.5_FG004 IPR000146 Fructose-1,6-bisphosphatase class 1/Sedoheputulose-1,7-bisphosphatase
AC147602.5_FG004 IPR023079 Sedoheptulose-1,7-bisphosphatase
AC148152.3_FG001 IPR002110 Ankyrin repeat
AC148152.3_FG001 IPR026961 PGG domain
我想使用 bash 来获得它:
AC147602.5_FG004 IPR000146 Fructose-1,6-bisphosphatase class 1/Sedoheputulose-1,7-bisphosphatase IPR023079 Sedoheptulose-1,7-bisphosphatase
AC148152.3_FG001 IPR023079 Sedoheptulose-1,7-bisphosphatase IPR002110 Ankyrin repeat IPR026961 PGG domain
因此,如果第一列中的 ID 在多行中相同,则应该为每个 ID 生成一行,并将行的所有其他部分连接起来。在示例中,它将给出两行文件。
【问题讨论】:
-
@oberlies,有时可以将标签添加到涵盖答案中使用但未在问题中提及的技术的问题。这就是其中一种情况,尤其是当替代方法是创建新的元标记时。
-
@close-voters:这个问题怎么可能太宽泛了?答案是一行 awk 脚本。