【发布时间】:2014-04-29 11:18:52
【问题描述】:
我在 python 中使用 scrapy
我可以在cmd中设置输出json文件。但现在我需要在代码中做到这一点。
我试过这个:
在设置中
FEED_EXPORTERS = {
'jsonlines': 'scrapy.contrib.exporter.JsonLinesItemExporter',
}
FEED_FORMAT = 'jsonlines'
在蜘蛛中
def __init(self):
settings.overrides['FEED_URI'] = 'output.json'
注意
我正在开发一个简单的蜘蛛,所以我只需要Item Exporter,我不需要创建任何项目管道。
感谢您的帮助
【问题讨论】:
-
有没有想过这个?
-
@Dagrooms 是的,我做过,但实际上我现在不记得了,因为我最终使用了一个管道,该管道将数据写入文件系统中的 JSON 文件和云上的数据库。
-
没问题,我已经开始工作了,但我还是需要 xml 格式。
标签: python python-2.7 scrapy