【发布时间】:2019-09-29 19:19:36
【问题描述】:
我想从 html img 标签中获取 src 值。 通过chrome和inspect元素我可以看到src的值,但是当我用jsoup库解析它时,src没有值,这是我的代码:
document = Jsoup.connect("http://estelam.rahvar120.ir/index.jsp?
pageid=2371666&p=1").userAgent(USERAGENT).method(Connection.Method.GET)
.execute().parse();
Element element = document.select("img[id=capimg]").first(); //img
tag element
String absoluteUrl = element.absUrl("src"); // absoluteUrl = ""
String srcValue = element.attr("src"); // srcValue = ""
该网站无法从其他国家/地区访问,但我想从 html 解析的地方是:
<img id="capimg" alt="Enter Captcha :"
src="" width="200" height="60">
问题是jsoup在javascript设置src值之前获取html内容,我该怎么办?
【问题讨论】:
-
您能否分享一个Minimal, Complete, and Verifiable example,包括您要解析的 HTML?
-
@SamuelPhilipp 谢谢,已应用更改。有用吗?
-
使用您共享的 HTML 测试了您的代码,但它似乎适用于
element.attr("src");。但是你的图片有一个空的 src 标签。 -
@SamuelPhilipp 是的,通过检查元素其可见但在视图源中并在使用 jsoup 解析后。 src 没有价值。
-
如果 src url 是通过 JavaScript 设置的,Jsoup 无法解析。
标签: android jsoup html-parsing