【发布时间】:2025-12-01 04:20:02
【问题描述】:
我想匹配一个结束标记,后跟一个 0+ 空格/换行符,然后是一个开始标记,后跟一个小写字母。例子:
-
text</p> <p>blah匹配</p> <p> -
text</i><i>and more text <b>but not this</b>匹配</i><i> -
text</i> <i>And more text不匹配
我试过这个:</.*?>\s*\n*\s*<.*>(?=[a-z]),但它不适用于第二个示例,因为它会匹配 </i><i> and more text </b>,即使问号应该使它“懒惰”。
【问题讨论】:
-
为什么不使用 HTML 解析器呢?正则表达式不是尝试和处理 HTML 的工具;它将导致pain and anguish..