【发布时间】:2011-04-01 06:17:44
【问题描述】:
我正在编写一个小型 Python 脚本来清理 HTML 文档。它的工作原理是接受 KEEP 的标签列表,然后解析不在列表中的 HTML 代码垃圾标签但不是结束标签。
我一直在尝试匹配结束标签的模式是</(?!a)>。这对我来说似乎是合乎逻辑的,所以为什么不起作用? (?!a) 应该匹配任何不是锚标记的东西(不是“a”可以是任何东西——这只是一个例子)。
编辑:AGG!我猜正则表达式没有显示!
【问题讨论】: