【发布时间】:2011-09-25 21:27:59
【问题描述】:
我有以下正则表达式(<.*?>.*?</.*?>|[\w[-]]+)\p{Punct}*,它适用于大多数带有标签的字符串,但如果标签前面没有空格,那么它会在找到匹配项时破坏标签。
请帮助我修改这个正则表达式,使其不会破坏标签。我正在寻找的只是在空格上分割,但如果空格在标签内,则不是。
例如:
BIRD-应该分成:
BIRD-<abc attr="co_1">ab @apos;我目前正在使用匹配器来匹配此模式并获取令牌
Matcher matcher = REGEX.matcher(newString);
while (matcher.find())
{
token = matcher.group();
}
【问题讨论】: