【发布时间】:2021-03-24 05:19:31
【问题描述】:
node.js / javascript 使用 puppeteer.js
我正在尝试使用 puppeteer 获取 xpath 的确切文本,但它只是将内容作为一个字符串返回。这里是 xpath 的 HTML 内容示例:
<div class="footNote" style="display: block;">
<br>
<strong>Note 17</strong>
<br>
34 people attended this event.
</div>
我用来抓取 xpath 文本的代码:
var xPath = `//*[@id="contentWrapper"]/div[${xNum}]/div[${yNum}]/div`
[qr] = await page.$x(xPath);
txt = await qr.getProperty('textContent');
const textContent = await txt.jsonValue();
console.log(textContent)
问题是,textContent 返回的字符串是“注意 1734 人参加了这个活动。”
我需要能够分别获得这两个字符串,而不是作为一个字符串混合在一起。任何帮助将不胜感激。
【问题讨论】:
标签: javascript node.js puppeteer