【问题标题】:Scrapy not scraping the percentage sign in a urlScrapy不抓取网址中的百分比符号
【发布时间】:2017-02-03 18:01:09
【问题描述】:

尝试使用 Scrapy 抓取图片链接。

这是我正在抓取的链接。

http://www.cars4sale.com/carimages/20TH%FEB%032.JPG

这就是它保存在 json 文件中的方式。请注意,百分号已被空格替换。

http://www.cars4sale.com/carimages/20THFEB 032.JPG

因此,当我显示此链接时,由于链接错误,我收到 404 错误。

如何让 Scrapy 抓取百分比符号?

【问题讨论】:

  • 我不知道scrapy,但我想在ifnal url中用“%”(百分比)替换“”(空格)将为你完成工作

标签: python scrapy


【解决方案1】:

你可以使用

urllib.quote(urlWithSpaceInIt)

你不必对这些乱七八糟的东西做任何事情。只需在访问之前引用 url。

【讨论】:

    【解决方案2】:

    好的,感谢 cmets,但我没有足够的经验来修复任何建议的方法,但他们帮助我找到了适合我的最终代码。

    事实证明,我以前没有注意到的百分比为 20。

    这是我在 JavaScript 中为 URL 添加 %20 所做的。

    img src=" + data[i].img.replace(/ | /g,"%20")

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-02-12
      • 2018-06-09
      相关资源
      最近更新 更多