【问题标题】:How do I get this text using Jsoup?如何使用 Jsoup 获取此文本?
【发布时间】:2012-03-14 02:36:52
【问题描述】:

如何使用 Jsoup 从以下 html 代码中获取“此文本”?

<h2 class="link title"><a href="myhref.html">this text<img width=10 
        height=10 src="img.jpg" /><span class="blah">
        <span>Other texts</span><span class="sometime">00:00</span></span>
        </a></h2>

当我尝试时

String s = document.select("h2.title").select("a[href]").first().text();

返回

此文本其他文本00:00

我尝试在 Jsoup 中读取 Selector 的 api,但无法弄清楚。

另外,我如何获得 class="link title blah" 类的元素(多个类?)。原谅我,我对 Jsoup 和 CSS 都略知一二。

【问题讨论】:

    标签: java css-selectors html-parsing jsoup


    【解决方案1】:

    使用Element#ownText() 代替Element#text()

    String s = document.select("h2.link.title a[href]").first().ownText();
    

    请注意,您可以通过将类名选择器连接在一起来选择具有多个类的元素,例如 h2.link.title 这将选择至少 both link 和 @987654329 的 &lt;h2&gt; 元素@类。

    【讨论】:

    • 另外我如何获得类`class="link title blah"(多个类)的元素?
    • 仔细检查代码示例。之后我在答案中添加了解释。
    猜你喜欢
    • 2013-04-03
    • 1970-01-01
    • 2015-04-30
    • 2017-06-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-04-30
    相关资源
    最近更新 更多