【问题标题】:Node.js scraping, converting image src -> full URLNode.js 抓取,转换图片 src -> 完整 URL
【发布时间】:2012-10-16 06:46:25
【问题描述】:

我正在使用 Cheerio (https://github.com/MatthewMueller/cheerio) 来抓取网站并获取我正在从事的项目的图像。我想知道 Node.js(或其他包)是否有一种简单的方法可以将 $(img).attr('src') 转换为完全限定的 URL?有时我会得到“image.jpg”,有时会得到“../../image.jpg”,有时会得到“//somepath/image.jpg”。也许我只是缺少某种正则表达式...感谢您的时间:)

【问题讨论】:

  • 我们需要废弃网站的 url... 或类似网站的示例。无论哪种方式,我都建议您自己构建一个额外的函数来解析这些值。
  • 哦,太棒了!我被完全相同的事情困扰着,为每一个手动写出解决方案。上帝保佑!

标签: javascript node.js path jsdom


【解决方案1】:

查看节点url 模块。具体来说,url.resolve(from, to) 应该是您要查找的内容。

【讨论】:

    猜你喜欢
    • 2014-04-15
    • 2010-11-12
    • 2016-11-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-06-18
    • 2016-10-07
    • 2019-04-08
    相关资源
    最近更新 更多