【发布时间】:2015-03-24 13:29:10
【问题描述】:
link = "http://blog.test.com/54321&sa=U&ei=1sTFVJLfOtOC8gW0jIHYCw&ved=0CBMQFjAA"
pat = re.compile("(.*)\&(.*)")
match = re.search(pat,link)
print match.group(1)
结果是http://blog.test.com/54321&sa=U&ei=1sTFVJLfOtOC8gW0jIHYCw
但我需要的是http://blog.test.com/54321
如何匹配我想要的结果?
请指导一下,谢谢
【问题讨论】:
-
这个网址看起来格式不正确 - 这是故意的吗?
-
我同意,该 URL 看起来格式不正确。通常
/54321&sa=U将是/54321?sa=U(注意?而不是&以启动参数列表)。 -
另外,已经有一个解析 URL 的模块:urlparse。为什么要在标准库中推出自己的标准库?