【发布时间】:2015-03-04 23:33:08
【问题描述】:
我正在尝试使用 Python 框架 Scrapy 从网站上抓取数据。我可以使用蜘蛛从网站获取数据,但是当我尝试浏览网站时会出现问题。
根据this post Scrapy 不能很好地处理 Javascript。
另外,正如接受的答案所述,我不能使用 mechanize 或 lxml。它建议使用Selenium and Scrapy 的组合。
按钮的功能:
我正在浏览网站上的优惠。按钮的功能 是显示更多优惠。所以点击它,它会调用一个javascript 加载结果的函数。
我也在看CasperJS and PhantomJS。他们会工作吗?
我只需要自动点击一个按钮。我该怎么办?
【问题讨论】:
-
真的取决于按钮。可以分享一下细节吗?
-
如果您使用 Selenium,Javascript 将在其他正常浏览器中执行。您当然可以仅使用 Selenium IDE 或 WebDriver 自动执行简单的按钮点击。
标签: javascript python selenium web-scraping scrapy