【发布时间】:2014-09-07 21:57:15
【问题描述】:
假设你有一个包含来自 html 文件的文本的字符串,你这样做了:
content = content.replaceAll("<[^>]*>", "");
我知道这基本上会删除所有的 html 标签。但是,如果我想保留看起来像这样的标签:
<> or < (any type/amount of blank space here) >
是否可以通过修改 replaceAll 来实现?如果是这样,怎么做?感谢您的任何意见/建议。
【问题讨论】:
-
"</?\\s*[^<\\s>]+\\s*/?>"怎么样?
标签: java regex string parsing replaceall