【问题标题】:scrapy crawl MySpider -o items.json outputs one json object per linescrapy crawl MySpider -o items.json 每行输出一个 json 对象
【发布时间】:2014-10-28 21:12:09
【问题描述】:

这是我得到的(不是有效的 json 对象):

{"id": 1, "name": John}
{"id": 2, "name": Tom}

这是我想要得到的(有效的 json 对象):

[{"id": 1, "name": John},
{"id": 2, "name": Tom}]

我希望能够直接使用 scrapy 的命令行工具(抓取)来完成。

【问题讨论】:

    标签: python json scrapy web-crawler


    【解决方案1】:

    您需要使用JsonItemExporter 而不是JsonLinesItemExporter。但是请注意,JsonLines 导出器更适合大型输出文件,因为您可以将文件解析为流。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2015-04-06
      • 2021-05-12
      • 1970-01-01
      • 2013-09-01
      • 1970-01-01
      • 2022-10-24
      • 1970-01-01
      • 2017-06-29
      相关资源
      最近更新 更多