【发布时间】:2012-05-30 18:35:53
【问题描述】:
使用 Jsoup 我试图找到错误的 html 结构,例如:
<body><p><h1>some text</h1></p></body>
我首先选择标题标签,然后使用headingElement.parent() 获取此h1 标签的父级。但我得到的是body,而不是p。
有谁知道为什么?
【问题讨论】:
使用 Jsoup 我试图找到错误的 html 结构,例如:
<body><p><h1>some text</h1></p></body>
我首先选择标题标签,然后使用headingElement.parent() 获取此h1 标签的父级。但我得到的是body,而不是p。
有谁知道为什么?
【问题讨论】:
JSoup 在解析 HTML 时,与任何好的 HTML 解析器一样,已经应用了 <h1> 标签自动关闭任何打开的 <p> 元素的规则,因此 <p> 和 <h1> 是已经是 DOM 中 <body> 元素的兄弟姐妹。
【讨论】: