【发布时间】:2018-06-15 00:15:21
【问题描述】:
我想从锚标记中提取内部文本以及从正则表达式中提取内部 html 标记。我尝试过但无法找到。我在下面提供了示例结构。
我的正则表达式是这样的:(class="related-article"(?:\s|\n))href="(.?)"(>(.*?)) "
我需要从下面的 html 内容中匹配我的正则表达式(标签):
<a class="related-article" href="10.1182/blood-2017-11-812990">
<i>Blood</i> Commentary</a> on this article in this issue.</p>
【问题讨论】:
-
使用 JSoup 或类似的东西并解析 HTML 可能更容易。
-
嗨 @RobbyCornelissen 不使用 JSoup 是否可以匹配我的正则表达式