【发布时间】:2013-11-13 13:27:46
【问题描述】:
我得到以下正则表达式来搜索页面中的视频链接
(http(s?):/)(/[^/]+)\\S+.\\.(?:avi|flv|mp4)
不幸的是,如果后面有另一个匹配项,例如这个视频链接,它不会在链接末尾停止
<a href="http://somevideo.flv">somevideoname.avi</a>
在正则表达式之后会返回这个:
http://somevideo.flv">somevideoname.avi
如何调整正则表达式以避免这种情况?我想了解更多关于正则表达式的知识,它很迷人但又很复杂!
【问题讨论】:
-
您想只查找来自
<a href="..">的链接,还是查找来自<span>http://someMovie.flv</span>等文本内容的链接? -
那么正则表达式不是正确的工具。您应该使用 HTML 解析器,例如 JSoup。