【问题标题】:Regular expression: Identify all html tag except <tr>, <td>, </td> or </tr>正则表达式:识别除 <tr>、<td>、</td> 或 </tr> 之外的所有 html 标签
【发布时间】:2015-04-12 16:58:34
【问题描述】:

我想问除了&lt;tr&gt;, &lt;td&gt;, &lt;/td&gt;, or &lt;/tr&gt;

之外的所有html标签怎么去掉

我可以
- 使用&lt;.*?&gt;识别所有html标签
- 使用^((?!&lt;tr&gt;)(?!&lt;td&gt;)(?!&lt;/td&gt;)(?!&lt;/tr&gt;).)*$ 识别&lt;tr&gt;, &lt;td&gt;, &lt;/td&gt;, &lt;/tr&gt;

但我就是不知道如何将这两个标准合二为一。

非常感谢。

【问题讨论】:

  • 使用解析器可以做到这一点。
  • 总是好的,如果你指定你正在使用的语言,欢迎 :)
  • 好的,我明白了。为此,我正在使用 Java。

标签: java regex html-parsing


【解决方案1】:

下面的正则表达式将匹配所有标签,但不匹配 td 或 tr。

<(?!\/?(?:t[dr])>).*?>

DEMO

【讨论】:

  • 知道哪个是合适的工具吗?顺便说一句,你的答案只保留 和 ,它仍然省略了 和
  • 你在运行哪个语言?
  • 我正在使用 Java,实际上我尝试在 primeface 数据表中显示用 html 编写的电子邮件内容。
猜你喜欢
相关资源
最近更新 更多
热门标签