【发布时间】:2016-05-14 08:08:10
【问题描述】:
我想删除文件中重复的字符串块
一个块由四行组成,例如:
路径名
起点
终点
电压数
如果终点重复,我想删除同一行上的重复块(?)。
例如,第一行和第二个块的结束点在第一行中是相同的,我只想保留第一个块。因此,第二个块在第一行被删除。
在第二行中,第一个和第三个块的结束点相同,并保留第一个块。
输入.txt:
path_sparc_ffu_dp_out_1885 path_sparc_ffu_dp_out_2759 path_sparc_ffu_dp_out_3115
R_1545/Q R_1541/Q R_1545/Q
dp_ctl_synd_out_low[6] dp_ctl_synd_out_low[6] dp_ctl_synd_out_low[2]
0.926208 0.910592 0.905082
path_sparc_ffu_dp_out_699 path_sparc_ffu_dp_out_712 path_sparc_ffu_dp_out_819
R_1053/Q R_1053/Q R_1053/Q
dp_ctl_synd_out_low[2] dp_ctl_synd_out_low[6] dp_ctl_synd_out_low[2]
0.945436 0.945436 0.9435
输出.txt:
path_sparc_ffu_dp_out_1885 path_sparc_ffu_dp_out_3115
R_1545/Q R_1545/Q
dp_ctl_synd_out_low[6] dp_ctl_synd_out_low[2]
0.926208 0.905082
path_sparc_ffu_dp_out_699 path_sparc_ffu_dp_out_712
R_1053/Q R_1053/Q
dp_ctl_synd_out_low[2] dp_ctl_synd_out_low[6]
0.945436 0.945436
我认为 awk/sed 可以完成这项工作。任何帮助表示赞赏。
最好的,
在英
【问题讨论】:
-
我试过'uniq',它只显示uniq字符串,但不知道如何显示uniq块,我试过awk,但我是awk的新手。所以,请。任何建议表示赞赏。
-
我知道这听起来很熟悉。恕我直言,您最好尝试修复您以前的 Q (stackoverflow.com/questions/37141953/…) 而不是这种方法。这种新布局使您更难理解您的问题。祝你好运。
-
嗨@jaeyoung-park,你所有的块都包含重复的还是只有其中的一部分?
标签: awk sed duplicates