【发布时间】:2026-01-12 18:45:02
【问题描述】:
我需要通过正则表达式从<div id="class1"> 到</div> 的末尾找到。我的文本中可能也有很多<div>。请在下面找到代码
This is example <div id="class1">This is <div id="subclass1">This is </div> <div id="subclass2">This is </div> This is </div> This is example
我已经尝试了下面的代码。但它只能到达<div id="subclass1"> 的第一个</div>
有什么可以帮我解决这个问题吗?
我试图捕获的代码是:
<div id="class1">(?:(?!<\/div>).)*?</div>
【问题讨论】:
-
请不要尝试使用正则表达式解析 HTML。正则表达式不能胜任这项任务。使用 HTML 解析器。 htmlparsing.com/perl.html 有一些 Perl 示例。
-
必填链接:*.com/questions/1732348 - 阅读此问题的答案
-
就像大多数人所说的,Perl 中有很多 HTML/XML 模块,但如果你想感觉自己构建了它,可能你会喜欢 Parse::RecDescent