【发布时间】:2015-05-15 15:25:59
【问题描述】:
我想知道是否有任何方法可以从这样的代码中提取:
<div class="container ">
<h2 class="job">
<a href="/work/android-developer/madrid/11537332" rel="nofollow"
title="job Android Developer" class="job-offer ">
Android Developer
</a>
</h2>
<h3 class="company">
<a href="/emp/nbc/133192">
NBC Corp.
</a>
</h3>
</div>
一次性发短信Android developer 和NBC Corp.?
doc.select("h2,h3.p-job-title,p-name-company a[href]"); 之类的东西不起作用。我也试过doc.select("h2.p-job-title a[href], h3.p-name company a[href]");
需要帮助!
编辑:我发现使用doc.select("h2.p-job-title + h3.p-name.company"); 可以提取所需的内容,但我需要的是一行中的 h2 内容 + h3 内容,我的意思是“Android Developer NBC Corp.”。这样我得到了:
“安卓开发者”
“NBC 公司”
【问题讨论】:
-
为什么不能自己连接字符串?
标签: java android html parsing jsoup