【发布时间】:2019-05-25 02:30:06
【问题描述】:
我正在使用 Jsoup 稍微改变一个 HTML,这个 HTML 有一些由网站的发布者注入的部分。 解析 HTML 时发生了一些奇怪的事情。 每当它有一个自动关闭的文本区域(我知道这是无效的,但出版商有时会这样做)时,以下元素会被转义,因为它们是文本区域的一部分,如下所示:
<div>
<div>
<textarea/>
</div>
</div>
变成
<div>
<div>
<textarea></textarea>
</div>
</div>
我希望它变成:
<div>
<div>
<textarea></textarea>
</div>
</div>
我可以做些什么来避免这种行为吗?
【问题讨论】:
标签: jsoup