【发布时间】:2021-06-03 23:48:01
【问题描述】:
我正在尝试抓取过去 5 年 yahoo Finance 特定股票的历史数据。我已经实现了一个 Python 代码,该代码 scraping 包含历史数据的表的每一行。我知道有更简单的方法来获取历史数据,但我想用 scraping 来做到这一点。问题是雅虎财务已经在其中实现了无限滚动,即一旦我到达网站的末尾,就会有更多的行被动态添加到表格中。但是我的代码只获取到第一页末尾的行,而不是完整的 5 年数据。这是我正在尝试的代码示例:
在scraping部分导航到行之后-
tableRows = table.find_all('tr', class_='BdT Bdc($seperatorColor) Ta(end) Fz(s) Whs(nw)')
我正在进一步从这些行中提取值
【问题讨论】:
-
介意分享网址吗?
-
仅供参考,报废/报废是关于扔掉的。刮/刮是正确的术语。
标签: python ajax selenium web-scraping beautifulsoup