【发布时间】:2010-07-08 01:50:01
【问题描述】:
我现在正在使用 Java 中的网页提取器,我很好奇在 Java 中执行此操作的最佳方法是什么。
我有一个链接:例如:http://www.nytimes.com/2010/07/08/technology/personaltech/08pogue.html?ref=technology
当我抓取该页面时,我可能会找到类似的 img src 路径
"../public/images/header.jpg"
"../../test/logo.gif"
它可能相对于文件所在的子目录之一
问题是.. 在 Java 中是否有一个库可以将这些转换为绝对路径,例如
http://www.nytimes.com/2010/07/08/technology/public/images/header.jpg
?
谢谢
【问题讨论】: