正则表达式：识别除 <tr>、<td>、</td> 或 </tr> 之外的所有 html 标签答案

【问题标题】：Regular expression: Identify all html tag except <tr>, <td>, </td> or </tr>正则表达式：识别除 <tr>、<td>、</td> 或 </tr> 之外的所有 html 标签
【发布时间】：2015-04-12 16:58:34
【问题描述】：

我想问除了<tr>, <td>, </td>, or </tr>

之外的所有html标签怎么去掉

我可以
- 使用<.*?>识别所有html标签
- 使用^((?!<tr>)(?!<td>)(?!</td>)(?!</tr>).)*$ 识别<tr>, <td>, </td>, </tr>。

但我就是不知道如何将这两个标准合二为一。

非常感谢。

【问题讨论】：

使用解析器可以做到这一点。
总是好的，如果你指定你正在使用的语言，欢迎 :)
好的，我明白了。为此，我正在使用 Java。

标签： java regex html-parsing

【解决方案1】：

下面的正则表达式将匹配所有标签，但不匹配 td 或 tr。

<(?!\/?(?:t[dr])>).*?>

DEMO

【讨论】：

知道哪个是合适的工具吗？顺便说一句，你的答案只保留和，它仍然省略了和
你在运行哪个语言？
我正在使用 Java，实际上我尝试在 primeface 数据表中显示用 html 编写的电子邮件内容。