【发布时间】:2011-12-12 16:50:32
【问题描述】:
我有完整的链接的 html 页面。但它们在 pre 标记内,如下所示
<pre class="alt2" dir="ltr" style="
margin: 0px;
padding: 6px;
border: 1px inset;
width: 640px;
height: 130px;
text-align: left;
overflow: auto">
http://test.com/files/tivist.r00
http://test.com/files/tivist.r01
http://test.com/files/fdfd.rar
http://test.com/files/gfgf.rar.html
http://test.com/files/trtr.zip
</pre>
</div><br />
页面上充满了类似的链接
有没有办法只获取整个页面的链接。
我正在使用记事本++。如果我能得到可以提取这些链接的正则表达式
【问题讨论】:
-
所以您只想从文件中删除任何不是链接的内容?
-
是的,我想要一个不错的链接列表,从 http 开始,以上面的任何扩展名结束
标签: html regex hyperlink notepad++ extract