【发布时间】:2020-01-04 19:50:14
【问题描述】:
我有以下 html:
<div class="CustomClass">
Hi!<br/>
<br/>
Bla Bla bla<br/>
<br/>
<a href...></a>
bla bla bla
<iframe...></iframe>
Thank you!
</div>
我需要一个包含 div 子项的列表,如下所示:
0->Hi!
2-><br/>
3->Bla Bla bla
4-><br/>
5-><a href...></a>
6->bla bla bla
7-><iframe...></iframe>
8->Thank you!
我尝试获取 div 元素的子元素,然后迭代子元素并将它们转换为 html,但这仅返回标记元素并忽略元素之间的文本。在理想情况下,文本会被 p 标签包围,但情况并非如此:S
如果我在 div 元素上使用 element.ownText 函数,那么我会得到没有标签的文本,我需要这两个东西,并且顺序正确:/
有没有办法做到这一点?
谢谢!
【问题讨论】:
标签: jsoup