使用 node.js 和 puppeteer 从具有挑战性的源代码中抓取网页

【问题标题】：web scraping from challenging source with node.js and puppeteer使用 node.js 和 puppeteer 从具有挑战性的源代码中抓取网页
【发布时间】：2021-02-04 01:18:22
【问题描述】：

我想网上刮舞蹈中心的时间表。目前，除了开始时间和课程持续时间之外，我几乎掌握了所有必需的信息，但我不知道如何获取这些数据：

定向链接：https://loftodance.pl/grafik

我使用 node.js + puppeteer。有什么想法吗？

【问题讨论】：

标签： node.js puppeteer

【解决方案1】：

使用 Chrome 开发工具。检查元素。

在开发工具中右键单击元素 > 复制 > 复制 XPath

那就用puppeteer的page.$x()

page.$x("//*[@id="scroll-hours-1-1"]/div[5]");

【讨论】：