【发布时间】:2017-09-19 14:42:03
【问题描述】:
假设内容如下:
<p><img src=\"https://abcd.com/pic.jpg\" alt=\"man with a umbrella on terrace with lots of xyz\" width=\"500\" height=\"400\" /></p>
如果使用以下代码行,JSOUP 会删除在任何属性中出现多次的单词。
Parser parser = Parser.htmlParser();
parser.settings(new ParseSettings(true, true));
Document doc = Jsoup.parse(modifiedContent,"",parser);
<p><img src=\"https://abcd.com/pic.jpg\" alt=\"man with a umbrella on terrace lots of xyz\" width=\"500\" height=\"400\" /></p>
with这个词被删除了。有关如何处理此问题的任何建议
【问题讨论】:
-
原始内容是HTML吗?还是
String? -
也就是说,您是从 HTML 文件中读取内容吗?