【问题标题】:Replacing html tags with regex (Java) [duplicate]用正则表达式(Java)替换html标签[重复]
【发布时间】:2014-09-07 21:57:15
【问题描述】:

假设你有一个包含来自 html 文件的文本的字符串,你这样做了:

    content = content.replaceAll("<[^>]*>", "");

我知道这基本上会删除所有的 html 标签。但是,如果我想保留看起来像这样的标签:

    <> or < (any type/amount of blank space here) >

是否可以通过修改 replaceAll 来实现?如果是这样,怎么做?感谢您的任何意见/建议。

【问题讨论】:

  • "&lt;/?\\s*[^&lt;\\s&gt;]+\\s*/?&gt;" 怎么样?

标签: java regex string parsing replaceall


【解决方案1】:
content = content.replaceAll("<[^>]*[^\\s>][^>]*>", "");

这应该匹配其中至少有一个非空白字符的标签。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-11-20
    • 2010-10-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多