【发布时间】:2019-05-11 21:13:03
【问题描述】:
假设您有一个网页:
<html>
<head>
<meta name="description" content="Hello World Test">
</head>
<body>
<h1>Hello World!!!</h1>
<p>How are you today?</p>
<p>What have you been up to?</p>
</body>
</html>
有没有办法循环遍历页面上的节点,然后,如果节点包含文本,则提取文本?
然后我想通过它的 Xpath 来组织文本。
所以上面是:
/html/body/h1:世界你好!!!
/html/body/p[1]:你今天好吗?
/html/body/p[2]:你最近在做什么?
非常感谢
【问题讨论】: