【问题标题】:How to scrape hidden website using python :: style display:none如何使用 python :: style display:none 抓取隐藏的网站
【发布时间】:2020-05-11 14:30:48
【问题描述】:

我试图抓取网站,但遇到了一个问题:网站中的数据被隐藏了,当我点击“+”号时,它显示了结果。

如何使用 python 抓取这些数据?

    <tr class="ob_gDGC" style="display: none;">

【问题讨论】:

  • 你有没有尝试过,做过任何研究?究竟是什么问题?

标签: python python-requests data-mining python-requests-html


【解决方案1】:

样式仅表示屏幕显示的内容而不是文档的内容,因此 display:none 不会限制您访问数据。

但是,如果您尝试访问的数据不在 dom 上,那么您就有问题了。在您单击按钮之前,在开发工具中查看该页面以查看数据是否存在。如果您单击按钮并附加子项(或 dom 节点在 google chrome 开发工具中闪烁),则您尝试抓取的网站使用 javascript dom 操作,这很难用 requests 库提取。为此,您将寻找像 pyppeteer (或等效)这样的包。有了它,您可以获得一个网页并模拟“加号”上的点击事件,然后提取您所需的数据。

我建议您修改您的帖子以使其更清晰,并添加一个您尝试抓取的 dom 的示例。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-02-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-06-18
    • 2021-07-27
    • 2017-02-20
    相关资源
    最近更新 更多