【发布时间】:2014-07-20 05:02:32
【问题描述】:
有 12.000 个我想删除的链接,并且只在记事本上显示链接文本
来自
<A HREF="/" CLASS="size0verdgr">HOME</A>
到 主页
来自
<A HREF="/NEW/" target="_blank">NEW</A>
到 新
我可以使用:
<a href="[^"]*" CLASS="[^"]*">
但是我只能删除标签的第一部分。
有什么解决办法吗?
【问题讨论】:
有 12.000 个我想删除的链接,并且只在记事本上显示链接文本
来自
<A HREF="/" CLASS="size0verdgr">HOME</A>
到 主页
来自
<A HREF="/NEW/" target="_blank">NEW</A>
到 新
我可以使用:
<a href="[^"]*" CLASS="[^"]*">
但是我只能删除标签的第一部分。
有什么解决办法吗?
【问题讨论】:
打开替换界面(Ctrl+H)。将搜索模式更改为“正则表达式”。
在搜索字段中输入以下模式,
<a[^>]*>([^<]+)</a>
它将匹配任何a-tag,以及标签之间的文本,您可以通过输入在替换字段中调用,
\1
最后,按下全部替换,你应该就完成了。
【讨论】:
据我了解,您想替换整行
<A HREF="/NEW/" target="_blank">NEW</A>
与
NEW
*nix 获胜
sed -i 's/<A HREF.\+>\(.\+\)<\/A>/\1/' test.txt
这就是正则表达式模式,因此您可以在任何搜索和替换正则表达式编辑器上运行它。根据编辑器,您可能需要删除一些反斜杠或将 \1 替换为 &1
【讨论】: