【发布时间】:2015-06-24 16:42:52
【问题描述】:
我正在抓取一个网站以将数据导出为语义格式 (n3)。 不过,我还想对该数据进行一些数据分析,因此将其保存为 csv 格式会更方便。
我可以同时获取两种格式的数据
scrapy spider -t n3 -o data.n3
scrapy spider -t csv -o data.csv
但是,这会抓取两次数据,我无法承受大量数据。
有没有办法将相同的抓取数据导出为多种格式?(无需多次下载数据)
我发现有一个可以导出为不同格式的抓取数据的中间表示很有趣。但是用scrapy似乎没有办法做到这一点。
【问题讨论】:
-
按照 alecxe 的建议,我在 scrapy 的 github github.com/scrapy/scrapy/issues/1336 上发布了一个功能请求
标签: python web-scraping scrapy exporter