【发布时间】:2016-09-14 15:13:26
【问题描述】:
我必须使用 Jsoup 从网页中提取一些数据。
我已经轻松提取了标签中包含的数据,但我仍然需要一些没有标签的数据。
这是 HTML 源代码的示例:
<a id="aId" href="aLink" style="aStyle">
<span id="spanId1">
<b>Caldan Therapeutics</b>
Announces Key Appointments And A Collaboration With
<b>Sygnature Discovery</b>
</span>
<span id="spanId2" style="spanStyle2">
5/17/2016
</span>
</a>
我已经提取了<b>标签中包含的数据以及日期,但我现在想要的是提取句子Announces Key Appointments And A Collaboration With。
如你所见,这句话没有标签。
我可以做些什么来提取它?
我已经完成了我的研究,我所能找到的只是如何去除所有标签。
感谢您的帮助!
【问题讨论】:
-
我已经看到了,它所做的只是去除 html 标签。这不是我想要的。我想要的是只提取未标记的句子
Announces Key Appointments And A Collaboration With