【发布时间】:2017-03-09 17:53:09
【问题描述】:
我是 Python 和网络爬虫的新手。我打算在website 的头条新闻中抓取链接。我被告知要查看它的 Ajax 请求并发送类似的请求。问题是对链接的所有请求都是相同的:http://www.marketwatch.com/newsviewer/mktwheadlines 我的问题是如何从这样的无限滚动框中提取链接。我正在使用美丽的汤,但我认为它不适合这项任务。我也不熟悉 Selenium 和 java 脚本。我知道如何通过 Scrapy 抓取某些请求。
【问题讨论】:
标签: python web-scraping scrapy infinite-scroll