【发布时间】:2011-06-25 19:36:29
【问题描述】:
有人知道我可以从 Java 网页获取信息的快速方法吗?例如,如果我正在查看这样的页面:http://www.ncbi.nlm.nih.gov/pubmed/?term=10952317,并且我想提取标题“MeSH 术语”下的单词列表,我该怎么做?
我有一些可以读取源代码的东西,但它充满了 HTML 标记等......
非常感谢任何帮助!
【问题讨论】:
有人知道我可以从 Java 网页获取信息的快速方法吗?例如,如果我正在查看这样的页面:http://www.ncbi.nlm.nih.gov/pubmed/?term=10952317,并且我想提取标题“MeSH 术语”下的单词列表,我该怎么做?
我有一些可以读取源代码的东西,但它充满了 HTML 标记等......
非常感谢任何帮助!
【问题讨论】:
正如之前在这里无数次提到的,看看JSoup,它是一个Java 的HTML 解析库。或者自己写(不推荐)。
【讨论】:
可能TagSoup 适合你。
【讨论】: