【发布时间】:2013-01-26 14:32:18
【问题描述】:
我正在尝试抓取位于 here 的 RSS 提要。
目前我只是想了解一下 JSoup,所以下面的代码只是概念证明(或者至少是一种尝试)。
public static void grabShakers(String url) throws IOException {
doc = Jsoup.connect(url).get();
desc = doc.select("title");
links = doc.select("link");
price = doc.select("span.price");
}
它完美地抓住了每个项目的标题。每个链接的输出只是十个重复的结束链接标签,它永远不会找到任何价格。我想也许 CDATA 是问题所在,所以我将 doc 转换为 html,使用 .replace 删除了 cmets,然后将其转换回 Document 以进行解析,但无济于事。任何见解将不胜感激。
以下代码是我用来打印每个元素的代码:
for (Element src : price) {
System.out.println(src);
}
【问题讨论】: