【发布时间】:2010-10-05 22:09:26
【问题描述】:
虽然我知道我可以使用一些巨大的正则表达式,例如发布在here 上的正则表达式,但我想知道是否有一些非常巧妙的方法可以使用标准模块或第三方插件来做到这一点?
简单的问题,但在 Google(或 Stackoverflow)上没有跳出来。
期待看到你们如何做到这一点!
【问题讨论】:
-
实际上,在这种情况下,人们通常不会严格匹配 url 模式。通常,尾随标点不被视为 URL 的一部分。这种选择是特定于应用程序的,因此缺少标准库模块。
-
@S.Lott-他在问关于从字符串而不是来自 html 的锚点解析 url
-
对于简单的使用使用 re.findall(r'www.[^\s]+?(?:in|com|extensions)',string)