【发布时间】:2020-04-23 05:18:54
【问题描述】:
我想从像 this (stat game of the game I play) 这样的网站中抓取数据,其中交互式图表在 <canvas> 元素中呈现,并且不将任何数据显示为可抓取的 HTML 元素。
检查 HTML,页面似乎使用chartjs。
虽然python中的帮助是首选,但如果我真的需要使用一些javascript,那也很好。
另外,我想避免使用需要额外文件的方法,例如 phantomjs,但同样,如果这是唯一的方法,请慷慨地分享它。
【问题讨论】:
-
对于 python 你可以使用 selenium
-
可以分享一下页面的网址吗?
-
@IainShelvington 我不知道如何使用硒从画布上抓取数据。我是网页抓取的菜鸟;;;
-
你不能刮canvas,因为它像图像,所以你需要使用一些软件来识别图像,但是你可以在你的页面上找到canvas里面的所有数据,例如在这个标签//div [@class='playerStatPage']/following-sibling::script 或在图像元素中,例如 //div[@id='ribbons-sm']/div[@class='ribbon-wrapper']跨度>
-
你不需要javascript
标签: javascript python python-3.x web-scraping chart.js