【发布时间】:2019-10-10 03:48:12
【问题描述】:
我想抓取一个股票网站并使用 selenium 获取价格。我不能使用普通的 HTML 请求,因为 HTML 是动态的。 我正在使用无头硒网络驱动程序来获取数据,但每个请求大约需要 30 秒。 有没有更快的方法来获取动态 HTML?
【问题讨论】:
-
要呈现整个动态网站,浏览器是必要的,而且需要时间。 Selenium 什么也没做。因此,这取决于网速、计算机性能以及用于 selenium 的浏览器。
-
您是否检查过该网站是否不提供 API?如果是,它会比试图刮掉它更快。此外,如果只有一页需要 30 scd 加载,那么您很可能无法减少加载时间。
-
如果您添加网站,我们可以看看我们是否可以帮助您找到更快的方法。
-
基础网站是“nasdaq.com/market-activity/stocks”,程序将每只股票的代码添加到 URL 的末尾。
标签: python selenium web-scraping dynamic-html