【发布时间】:2022-07-22 01:36:21
【问题描述】:
我们如何将haaaaaaapppppyyyyyy 之类的字符串缩减为haappyy
这样字符串中的一个字符连续最多允许重复两次吗?
包括任何字符(也包括特殊字符)
将--------------------- 转换为--
【问题讨论】:
标签: python regex replace data-cleaning data-preprocessing
我们如何将haaaaaaapppppyyyyyy 之类的字符串缩减为haappyy
这样字符串中的一个字符连续最多允许重复两次吗?
包括任何字符(也包括特殊字符)
将--------------------- 转换为--
【问题讨论】:
标签: python regex replace data-cleaning data-preprocessing
我们可以使用正则表达式替换:
inp = "haaaaaaapppppyyyyyy"
output = re.sub(r'(\w)\1{2,}', r'\1\1', inp)
print(output) # haappyy
上述逻辑匹配任何一个其后跟两次或多次的字符。然后它只替换为两个字符。
【讨论】:
--------------------- 转换为--