【发布时间】:2020-05-03 12:12:32
【问题描述】:
我有一长串这样的情况,第二个单词(空格后的第二个字符串)相同的行,但其余的不同。我只需要保留一行唯一的第二个字符串。仅适用于具有相同第二个单词且始终连续的行。例如,我有几行:
lineA 12345
lineB 12345
lineC 12345
lineD 788878
lineE 110881
lineF 110881
lineG 110881
lineH 287778
lineJ 251287
lineK 242424
lineL 242424
lineM 242424
到这个结果
lineA 12345 线D 788878 线E 110881 线H 287778 线J 251287 线K 242424
因此,如果行中的第二个单词是匹配项,则删除除一行之外的所有单词。 我尝试创建正则表达式,但只有在第一个单词匹配时才会删除,我不知道如何像示例中那样为空格后的第二个单词执行此操作。
^(\S++).*\K(?:\R\1(?:\h.*|$))+
【问题讨论】:
标签: regex replace duplicates notepad++