【发布时间】:2015-04-10 18:50:35
【问题描述】:
在 HTML 文档中,我有以下标签
<a id="myUniqueID" class="myClassName" href="/uniqueURLToExtract" data-original-title"">This is a Title</a>
我正在使用 JSoup,并希望提取包含在由 myUniqueID 标识的 href 中的 URL。在阅读了以下关于 SO 的主题后
我想出了这个sn-p的代码
...
document = Jsoup.connect(mySiteAddress).timeout(10*1000).get();
...
String URLStr = document.select(a[id=myUniqueID]").text();
但这只是打印
This is a Title
我尝试了其他变体,但都没有成功。我要么什么都没打印,要么以空指针异常告终。
我不确定如何提取由<a> 标记中的 id myUniqueID 标识的 URL。
【问题讨论】:
-
提前关闭的标签是错字吗?
<a> id="myUniqueID" class="myClassName"... -
检查这个答案,我猜你需要什么:stackoverflow.com/a/6933687/2196341
-
@AdrianLynch 是的,这是一个错字。对于那个很抱歉。我在原始问题中解决了这个问题。
-
@TheUknown 感谢分享。