【问题标题】:Get encoded html content only from url in java仅从 java 中的 url 获取编码的 html 内容
【发布时间】:2011-07-25 10:35:46
【问题描述】:

在 JAVA 中是否有可以对 HTML 进行编码但只能对内容进行编码的库?

我喜欢

<div>Tél</div>

我只想要

<div>T&eacute;l</div>

而不是

&lt;div&gt;T&eacute;l<&lt;/div&gt;

我需要这个库来编码整个 HTML。 我已经尝试过库 JSoup,但是在处理某些对象时会出现错误。

谢谢

【问题讨论】:

  • 为什么首先要将字符转换为它们的 HTML 实体?如果您使用的是 UTF-8,那应该是没有必要的。

标签: java html encode jsoup


【解决方案1】:

使用正则表达式解析 HTML 从来都不是一个好主意,这是灾难的根源。

所以先看看这个java中HTML解析的问答:Java HTML Parsing

一旦您能够解析 HTML 并获取内部 HTML 文本,您就可以通过以下方式之一对 HTML 进行编码:Is there a JDK class to do HTML encoding (but not URL encoding)?

【讨论】:

    猜你喜欢
    • 2016-12-15
    • 2017-10-16
    • 2015-03-05
    • 2015-03-26
    • 1970-01-01
    • 2021-07-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多