【发布时间】:2015-08-09 11:14:19
【问题描述】:
我正在使用 JSoup 将包含 HTML 标记的字符串解析为纯文本。例如:
String newStr = Jsoup.parse(testStrHTML).text();
它解析得很好,但问题是我的 Java 字符串是否包含 < 和 > 之间的数据,例如Hello <test@gmail.com> 所以它正在删除电子邮件地址数据。我得到的输出是 Hello,我期待的是 Hello <test@gmail.com>。
我用正则表达式也试过了
String newStr = testStrHTML.replaceAll("\\<.*?\\>", "");
但还是有问题。
在<和>之间有没有自定义数据解析HTML标签
【问题讨论】:
-
查看我在 stackoverflow 上找到的 this 答案。希望它能帮助您解决该问题:)