【问题标题】:Get text from HTML page with Jsoup [closed]使用 Jsoup 从 HTML 页面获取文本 [关闭]
【发布时间】:2013-09-16 03:19:51
【问题描述】:

我想制作一个用于获取统计信息的安卓应用。假设我想从www.oc.tc/MasterEjzz 获取杀戮和死亡并将它们打印在屏幕上。我知道 Jsoup 是一个很好用的 API,但我不熟悉它。

任何帮助将不胜感激。

【问题讨论】:

  • 有时当我使用jsoup解析rss feed时,一些网站rss在rss feed的描述标签中使用了html。所以我使用了以下内容:String description=android.text.Html.fromHtml(defaulttext)。 toString();其中 defaulttext 是已经解析的 rss 提要的描述。

标签: java android html parsing jsoup


【解决方案1】:

来自Jsoup介绍documentation

要连接和下载文档,可以使用

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();

然后从Document中提取内容,

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}

有关DOM Navigationsee的更多信息

【讨论】:

  • 我明白,但我如何解析它才能只得到文本?
  • 查看DOM Navigation的链接,只需使用idclass获取Element并使用textattr方法获取您需要的信息。跨度>
  • 好的,我会试试看,如果我可以让它工作,我会将这篇文章标记为已解决。谢谢!
猜你喜欢
  • 1970-01-01
  • 2016-07-06
  • 2019-09-16
  • 2013-05-27
  • 1970-01-01
  • 2022-08-18
  • 1970-01-01
  • 2018-02-07
  • 2013-11-09
相关资源
最近更新 更多