【发布时间】:2021-12-09 03:35:56
【问题描述】:
我制作了一个 Scrapy 代码,其中有 4 个爬虫从 4 个不同的电子商务网站抓取数据。对于每个爬虫,我想从每个网站输出 5 个最低价格的产品,并将它们导出到单个 CSV 文件中。
现在,我的主要代码如下所示:
process = CrawlerProcess()
process.crawl(Crawler1)
process.crawl(Crawler2)
process.crawl(Crawler3)
process.crawl(Crawler4)
process.start()
我希望每个爬虫返回一个字典列表,以便我可以使用 for 循环遍历它并比较价格。
我需要使用 Scrapy Pipeline 来执行此操作吗?我怎样才能让 Scrapy 返回一个已抓取项目的列表(在字典中),而不仅仅是将它们导出为文件?
【问题讨论】:
标签: python web-scraping scrapy