【发布时间】:2018-07-21 16:01:56
【问题描述】:
我正在尝试从 GlassDoor 中提取平均工资。 这是它所在的 HTML 代码:
<span class="OccMedianBasePayStyle__payNumber" data-test="AveragePay">$118,034</span>
这是我目前所拥有的.. 此代码输出我想要的行,但我不知道如何从 data-test="AveragePay" 中提取薪水
public class Trans {
public static void main(String[] args) {
String url = "https://www.glassdoor.com/Salaries/seattle-software-engineer-salary-SRCH_IL.0,7_IM781_KO8,25.htm";
Document document = null;
try {
document = Jsoup.connect(url).get();
} catch (IOException e) {
e.printStackTrace();
}
//a with href
Elements links = document.select("span");
for (Element link : links) {
System.out.println("Text: " + link.getElementsByAttributeValueContaining("data-test", "Average"));
//System.out.println("Text: " + link.text());
}
【问题讨论】:
-
你的问题到底是什么?
-
我的输出只是输出值,我不知道如何确定我想要的值。我希望能够输出“data-test="AveragePay" 的值
-
我昨天开始抓取网页,所以我可能走错了路。我只是不知道如何从我想要的特定位置提取数据。
标签: java html web-scraping jsoup