【问题标题】:Wrong URL when parsing HTML with Jsoup Android使用 Jsoup Android 解析 HTML 时 URL 错误
【发布时间】:2026-01-20 04:00:01
【问题描述】:

你能帮我解析html网站吗? 我需要获取图像的 src 并链接到另一个页面,但我不知道为什么我得到空列表 这是我的代码:

Elements elems2 = doc.select("div");
for (Element elem2 : elems2) {
    if (elem2.attr("class").equals("grid-box-img")) {
        System.out.println(elem2.attr("img"));
        kfunewphoto.add(elem2.attr("src"));
    }
}

及html示例:

<div class="grid-box-img"><a href="http://cleverrussia.com/shou-talanty-uspej-uvidet-pervym/" rel="bookmark" title="Шоу &#8220;Таланты&#8221;. Успей увидеть первым!"><img width="680" height="470" src="https://i.stack.imgur.com/c7PGK.png" class="attachment-full wp-post-image" alt="shou-talanty-uspej-uvidet-pervym-clever-russia" /></a></div>

我需要得到“http://cleverrussia.com/wp-content/uploads/2014/10/shou-talanty-uspej-uvidet-pervym-clever-russia.png”和第二部分代码:

            Elements elems = doc.select("h2");
            for (Element elem : elems) {
                if (elem.attr("class").equals("entry-title")) {
                    str = elem.text();
                    kfunews.add(elem.text());
                    kfunewslist1.add(elem.attr("href"));
                }

<h2 class="entry-title"><a href="http://cleverrussia.com/shou-talanty-uspej-uvidet-pervym/" title="Permalink to Шоу &#8220;Таланты&#8221;. Успей увидеть первым!" rel="bookmark">Шоу &#8220;Таланты&#8221;. Успей увидеть первым!</a></h2>

我需要得到:“http://cleverrussia.com/shou-talanty-uspej-uvidet-pervym/
这是页面的完整代码 - 查看源代码:http://cleverrussia.com/

【问题讨论】:

    标签: java android html jsoup


    【解决方案1】:

    错误是您尝试选择 img 和 a 作为属性。检查以下代码以了解如何修复您的代码。

    // Prints the image source
    System.out.println(elem2.select("img").attr("src"));
    kfunewphoto.add(elem2.select("img").attr("src"));
    // Prints the target link
    System.out.println(elem.select("a").attr("href"));
    kfunewslist1.add(elem.select("a").attr("href"));
    

    【讨论】: