【发布时间】:2015-08-08 10:59:58
【问题描述】:
我有这个 HTML 块:
<div class="singolo-contenuto link_azure">
<p>I'm a TEXTXXXXXXXXXXXXXXXX<p>
<a href="http://example.com">Name of URL</a></p></p>
<ul class="list_attachments"><li><a
href="DON'T TOUCH"><img src='/img/fileicons/file.png' alt='file'/> TITLE</a></li></ul>
</div>
<div class="clear"></div>
实际上我正在接受文本:
document.select(".singolo-contenuto").text();
这又回到了我身边: “我是 TEXTXXXXXXXXXXXXXXXX 网址的名称”。无法获取“我是 TEXTXXXXXXXXXXXXXXXX http://example.com URL 名称”吗?
在所有页面中并不总是相同的。 我只确定 text 和 href 将在 ""singolo-contenuto link_azure" 类中。
【问题讨论】:
-
This post 将有助于您获取锚标签的
href信息。虽然我不确定您是否可以直接在您的div.text()通话中强制执行此操作。之后您可以进行单独的调用并操作字符串。 -
从技术上讲,href 不是文本,而是标记的一部分。
标签: java android html html-parsing jsoup