【发布时间】:2021-01-29 18:16:59
【问题描述】:
我必须将字符串从内容类型 text/html 转换为 application/xhtml+xml 并从 windows-1252 转换为 UTF-8
charset
public Document.OutputSettings charset(Charset charset)
Update the document's output charset.
html 源代码包含类似
<meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
当前的xml/html输出是
<meta http-equiv="Content-Type" content="text/html; charset=windows-1252" />
目前的指令是
org.jsoup.nodes.Document doc = Jsoup.parse(htmlString);
doc.outputSettings(new OutputSettings().syntax(Syntax.xml).escapeMode(EscapeMode.xhtml));
OutputSeetings 是否能够创建类似的字符串
<meta http-equiv="Content-Type" content="application/xhtml+xml; charset=UTF-8" />
如果是这样,怎么做?还是有其他方法可用?
【问题讨论】:
标签: jsoup