【发布时间】:2018-10-11 22:44:24
【问题描述】:
我已经尝试了一段时间来弄清楚如何自动下载此页面上的 csv: https://razzball.com/mlbpitchingstats/
在顶部,您可以单击一个基本的 html 输入框,然后单击该框上的下载。我知道我可以弄清楚如何使用无头驱动程序执行此操作,但我一直在尝试弄清楚如何使用请求或以某种方式访问下载按钮侦听器。
在监控网络选项卡时,似乎没有对 api 的请求。 我是使用无头浏览器的唯一选择吗?有没有办法通过请求来解决这个问题?任何帮助都会很大!
【问题讨论】:
-
我怀疑这只是 JS 将 html 表转储为 csv。他们那样做有点烦人,但无论如何。您可以使用 beautifulsoup 来抓取表格并自己解析为 csv。不确定是否有内置功能可以帮助解决此问题,但怀疑这是第一次有人尝试这样做
-
的查看,我不能完全告诉.. 似乎数据是由 javascript 填充的.. 所以 beautifulsoup 可能会失败:(
-
如果你“查看页面源代码”,表格数据就会出现在那里,所以值得一试。但如果没有,您可以使用 selenium 轻松实现。
标签: javascript python html beautifulsoup request