【发布时间】:2012-10-16 06:46:25
【问题描述】:
我正在使用 Cheerio (https://github.com/MatthewMueller/cheerio) 来抓取网站并获取我正在从事的项目的图像。我想知道 Node.js(或其他包)是否有一种简单的方法可以将 $(img).attr('src') 转换为完全限定的 URL?有时我会得到“image.jpg”,有时会得到“../../image.jpg”,有时会得到“//somepath/image.jpg”。也许我只是缺少某种正则表达式...感谢您的时间:)
【问题讨论】:
-
我们需要废弃网站的 url... 或类似网站的示例。无论哪种方式,我都建议您自己构建一个额外的函数来解析这些值。
-
哦,太棒了!我被完全相同的事情困扰着,为每一个手动写出解决方案。上帝保佑!
标签: javascript node.js path jsdom