【发布时间】:2015-04-14 08:33:53
【问题描述】:
我有一个作为字符串接收的 HTML 文档,然后我使用 jSoup 对其进行解析。
该 HTML 文档(字符串形式)包含 <link> 标签如下 -
<link rel="stylesheet" href="css/bootstrap.css" />
这就是我解析它的方式-
Document doc = Jsoup.parse(html);
其中html 是一个字符串形式的 HTML 文档。
在我打印doc 时解析后,除了<link> 标记更改为-
<link rel="stylesheet" href="css/bootstrap.css">
请注意这里没有结束斜线。
另请注意,如果原始字符串包含以下形式的<link>标签-
<link rel="stylesheet" href="css/bootstrap.css"></link>
结果还是一样,即<link rel="stylesheet" href="css/bootstrap.css">
Jsoup 为什么要这样做,我该如何防止这种情况发生?
谢谢!
【问题讨论】:
-
它实际上是在改变链接的
href,还是你只是指缺少的/? -
@jurgemaister 对不起。我在复制数据时出错。我已经编辑了我的问题。