【问题标题】:web scraping from challenging source with node.js and puppeteer使用 node.js 和 puppeteer 从具有挑战性的源代码中抓取网页
【发布时间】:2021-02-04 01:18:22
【问题描述】:

我想网上刮舞蹈中心的时间表。目前,除了开始时间和课程持续时间之外,我几乎掌握了所有必需的信息,但我不知道如何获取这些数据:

定向链接:https://loftodance.pl/grafik

我使用 node.js + puppeteer。有什么想法吗?

【问题讨论】:

    标签: node.js puppeteer


    【解决方案1】:

    使用 Chrome 开发工具。检查元素。

    在开发工具中右键单击元素 > 复制 > 复制 XPath

    那就用puppeteer的page.$x()

    page.$x("//*[@id="scroll-hours-1-1"]/div[5]");
    

    【讨论】:

      猜你喜欢
      • 2013-09-16
      • 1970-01-01
      • 1970-01-01
      • 2016-09-25
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-08-13
      • 1970-01-01
      相关资源
      最近更新 更多