【发布时间】:2011-07-18 20:57:09
【问题描述】:
我知道使用 urllib 可以解析字符串并检查它是否是有效的 URL。但是如何去检查一个句子中是否包含一个 URL,然后提取那个 URL。我已经看到了一些巨大的正则表达式,但我宁愿不使用我真的无法理解的东西。
所以基本上我有一个输入字符串,我需要找到并提取该字符串中的所有 URL。
什么是解决这个问题的干净方法。
【问题讨论】:
-
如果您的输入源是 html 或 xml,请不要这样做,而是使用适当的解析器。
-
你能发布一个典型的示例输入吗?
-
URL 匹配是一个相当大的话题,有很多规则......这就是为什么你发现的所有正则表达式都很大并且难以理解。尝试检查此正则表达式(拆分以匹配各种 URL 部分):stackoverflow.com/questions/9760588/…