【发布时间】:2015-06-12 16:41:15
【问题描述】:
我有一个包含如下内容的 html 文件:
<div class="title"><a href="../dorothy_perkins_true_blue_suedette/thing?id=130434603" title="Dorothy Perkins True blue suedette clutch bag">Dorothy Perkins True blue suedette clutch bag</a></div>
我想提取href中的url。我有以下代码:
Document doc = Jsoup.connect(url).get();
Elements products = doc.select("div.title a[href]");
System.out.println("size: "+products.size());
打印显示,但是,大小为 0。它找不到任何匹配项。我使用的网址是http://www.polyvore.com/bags/shop?category_id=35。你可以看看源代码,我很确定上面的代码是正确的。如果有人能给出一些想法,那就太好了。非常感谢。
【问题讨论】:
-
好像网站不想被抓取,所以你必须按照下面的答案更改用户代理。
标签: java javascript jquery html jsoup