【发布时间】:2020-04-10 02:15:09
【问题描述】:
我正在尝试获取标签之间的文本并保存到某个变量中,例如:
在这里,我想保存 return 之间的值 em 标签。我还需要p标签中的其余文本,
em 标记值分配有 return 和
p 标签值应该只返回 --> an item, cancel an order, print a receipt, track your purchases or reorder items.
如果某个值在em 标签之前,即使该值也应该在不同的变量中,基本上是一个p 如果它有多个标签,那么它应该被拆分并保存到不同的变量中。如果我知道如何获取不在内部标签中的其余文本,我可以检索其余部分。
我在下面写了:下面只返回“em”标签中的“return”。
这里ep 基本上是doc.select(p),选择p 标签然后迭代,不确定我的方法是否正确,任何其他方法都非常感谢。
String text ="\<p><em>return </em>an item, cancel an order, print a receipt, track your purchases or reorder items.</p>"
Elements italic_tags = ep.select("em");
for(Element em:italic_tags) {
if(em.tagName().equals("em")) {
System.out.println( em.select("em").text());
}
}
【问题讨论】:
标签: java html parsing jsoup html-parsing