【发布时间】:2016-07-26 15:51:14
【问题描述】:
我正在尝试使用 Scrapy 抓取网站,但是网站 URL 没有改变,页面是使用 java 脚本加载的。
在这些条件下,我如何使用 Scrapy 从网站获取数据?
【问题讨论】:
-
你必须找出用javascript发出的请求(也许你也可以用scrapy自己做),或者你必须使用像selenium这样的东西。我们推荐splash
-
我可以使用浏览器查找正在发出的请求吗? @eLRuLL
-
这就是 splash 和 selenium 所做的,它们模拟轻量级浏览器。
-
添加 url 和你当前工作的蜘蛛
标签: python web-scraping scrapy scrapy-spider