【发布时间】:2021-09-23 18:04:38
【问题描述】:
我正在使用 for 循环构造一个正则表达式查询,如下所示:
query = '^(?:'
for num, element in enumerate(my_list):
values = element.split('-')
if num > 0:
query += '|'
for v in values:
query += f'(?=.*{v})'
query += ')'
my_list = ['a-b', 'b-c']
但是,我认为这是低效的,因为这会导致二次运行,因此可能无法很好地扩展。
如何转换此流程以避免这种低效率?
我在想一些与 .join() 方法相关的事情,但我很困惑这在我的情况下如何工作,因为它对我来说似乎并不简单。
【问题讨论】:
-
“二次运行时”相对于什么?
-
缺少一个左括号
-
添加括号,谢谢@azro
-
@ScottHunter 有人告诉我,这种方法的总序列长度的运行时间成本是二次方
-
请描述这是要做什么。你最终会得到
(?=.*a}(?=.*b)|(?=.*b)(?=.*c),这是一个相当昂贵的正则表达式,而且由于这些是“非消耗”匹配,我真的不知道你想要实现什么。