【问题标题】:jsoup select elementsjsoup 选择元素
【发布时间】:2012-07-02 05:08:52
【问题描述】:

我正在尝试使用 jsoup 抓取网站的数据。但是在获取一些文本时遇到了一些问题。

部分html看起来像这样

<p class="time">9:00</p>

使用这行代码我可以很好地抓住:

Document doc = Jsoup.connect(url).get();
doc.select("p.time").text());

但下一段 html 看起来像这样:

<p class="date"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p>

我不知道如何获得。使用线路:

doc.select("p.date").text());

只是给我一个空字符串。我已经尝试过它的变体(即选择“p.date”,然后尝试 date.select("strong")),但只是不断提出一个空字符串。

如何获取该日期文本?

【问题讨论】:

  • 例如doc.select("p.date").child(0).text(); 怎么样?或doc.select("p.date strong").text();

标签: java html jsoup


【解决方案1】:

无法重现您的问题。

Document doc = Jsoup.parse("<html><body><p class=\"date\"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p></body></html>");
String s = doc.select("p.date").text();
System.out.println(s);

打印:“2012 年 7 月 27 日星期五”

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2011-09-23
    • 1970-01-01
    • 2015-10-31
    • 2016-08-16
    • 1970-01-01
    • 1970-01-01
    • 2012-05-30
    • 1970-01-01
    相关资源
    最近更新 更多