【发布时间】:2015-10-20 21:43:09
【问题描述】:
例如,您想选择所有标题标签,无论是h1,还是h2,或h3,或其他标签。
你是做什么的?
试过了:
.//following-sibling::h*
.//following-sibling::[h3|h4]
.//following-sibling::(h3|h4)
.//(following-sibling::h3|following-sibling::h4)
他们都没有工作....
更新:
这是我试图搜索的 html:
<h3 class='title'>title1</h3>
<p> paragraph 1<p>
<p> paragraph 2<p>
<p> paragraph 3<p>
<h3 class='title'>title1</h3>
<p> paragraph 1<p>
<p> paragraph 2<p>
<h4 class='title'>title1</h4>
<p> paragraph 1<p>
<p> paragraph 2<p>
<p> paragraph 3<p>
<p> paragraph 4<p>
<h2 class='title'>title1</h2>
<p> paragraph 1<p>
<p> paragraph 2<p>
<p> paragraph 3<p>
所以每个标题之间可能随机有2-5个段落,标题可以是h2、h3或h4。
给定一个标题元素,收集所有段落直到下一个标题。
(我的方法是找到下一个标题并返回查找所有段落。)
【问题讨论】:
-
发布您想要获得的 XML 示例和结果。你的解决方案可能根本不好。
-
你的问题不清楚!!你说的for follow-sibling是什么意思??
-
在
.//之后使用following-sibling很奇怪。这不是一个错误,但这是一件非常奇怪的事情。它基本上选择不是其父节点的第一个子节点的每个后代或自我节点。
标签: html xpath xpath-2.0 domxpath