【发布时间】:2017-05-02 08:33:22
【问题描述】:
请看下面的简化示例:
public static void main(String[] args) {
String html = "<html>\n" +
" <head></head>\n" +
" <body>\n" +
" <div> \n" +
" <p> 2 <= X </p> \n" +
" </div>\n" +
" </body>\n" +
"</html>";
Document doc = Jsoup.parse(html);
System.out.println(doc.select("p").outerHtml());
}
这会打印出<p> 2 &lt;= X </p>,但我希望所选的 html 部分会按原样打印出来:<p> 2 <= X </p>。我如何告诉 jsoup 不要转换 '
【问题讨论】:
-
您的输入不是有效的 HTML。 Jsoup 为您转义它是正确的。
-
我无法控制输入。有没有办法告诉 jsoup 忽略 html 的有效性并按原样解析文档以获得所需的输出?