【发布时间】:2020-04-03 06:32:37
【问题描述】:
我刚开始学习python,如果这个问题已经被问到了,很抱歉。
我写在这里是因为那些对我没有帮助,我的要求是读取一个文件并打印其中的所有 URL。在 for 循环中,我使用的正则表达式模式是 [^https://][\w\W]*,它工作正常。但我想知道我是否可以动态传递 https:// 之后的行长度并获得出现次数的输出而不是 *
我试过[^https://][\w\W]{var}}var=len(line)-len(https://)
这些是我尝试过的其他一些模式
pattern = '[^https://][\w\W]{'+str(int(var))+'}'
pattern = r'[^https://][\w\W]{{}}'.format(var)
pattern = r'[^https://][\w\W]{%s}'%var
【问题讨论】:
-
现在你的模式很奇怪。例如,您是否意识到
[^https://]与行首的字符串https://不匹配?相反,它匹配任何单个字符,它不是 h、t、p、s、: 或 / 之一。 -
是的,我现在意识到了我的 https 模式,感谢您发现它
-
@JACK,提供的任何答案对您有帮助吗,如果有,请记住标记答案,以便其他人也可以从中受益。
标签: python regex variables int