【发布时间】:2014-11-09 02:47:54
【问题描述】:
我想从我的 html 中删除 <a> 标记和链接文本。
简单示例:
String inputString = "<html><p>test <a href="example.com">link</a> </p></html>";
我尝试使用这样的东西:
String result = inputString.replaceAll("</?a[^>]*>", " ");
但它只删除<a>标签
预期输出:
String result = "<html><p>test</p></html>";
【问题讨论】:
-
1.发布此类问题时,您应该显示预期的输出。 2 你不应该使用正则表达式来解析html。
-
试试jsoup好吗?
-
Jsoup 推荐 +1
标签: java html regex string tags