【发布时间】:2014-11-11 19:18:36
【问题描述】:
我是新手。在用我的爬虫测试了几个网站后,我发现了以下内容:
<div class="originalCurrencyInformation">
<label class="Hidden original-price">Price: £500</label>
注意 class:Hidden 而不是 type="Hidden"。如何使用任何库检索价格,但我的偏好是 Jsoup。
这里是一个示例 sn-p 代码:
Document doc = Jsoup.connect("http://www.example.org")
.timeout(3000).get();
Elements tags = doc.select("div.originalCurrencyInformation > Label.original-price");
for(Element tag: tags){
System.out.println(tag);
}
更新
我尝试过 Label.Hidden original-price 和 Label.Hidden.original-price 但值返回 null,这就是我得到的
【问题讨论】:
-
你似乎已经有了解析 html/xml 的方法。
class="Bla"只是一个类名,主要用于处理 css 样式表或作为 JavaScript 的标识符,它只是一个名称,不要与style="visibility:hidden"或type="hidden"混淆。
标签: java jsoup hidden-field