【发布时间】:2013-01-14 04:20:50
【问题描述】:
我试图匹配大部分数字,但取决于表达式后面的单词,我需要有所作为。
我匹配每个没有后跟温度术语(如°C)或时间规范的数字。 我的正则表达式如下所示:
(((\d+?)(\s*)(\-)(\s*))?(\d+)(\s*))++(?!minuten|Minuten|min|Min|Stunden|stunden|std|Std|°C| °C)
这是一个例子:http://regexr.com?33jeg
虽然这种行为是我所期望的,但 Java 会执行以下操作: 索引是匹配4的对应组
0: "4 "1: "4 "2: "0 - "3: "0"4: " "5: "-"6: " "7: "4"8: " "9: "°C"
您需要知道我将每个字符串单独匹配。所以 5 的比赛看起来像这样:
0: "5 "1: "5 "2: "null"3: "null"4: "null"5: "null"6: "null"7: "5"8: " "9: "null"
这就是我喜欢其他 Match 的方式。这种令人不快的行为仅在匹配之前的字符串中某处出现“-”时
我的 Java 代码如下:
public static void adaptPortionDetails(EList<Step> steps, double multiplicator){
String portionMatcher = "(((\\d+?)(\\s*)(\\-)(\\s*))?(\\d+)(\\s*))++(?!°C|Grad|minuten|Minuten|min|Min|Stunden|stunden|std|Std)";
for (int i = 0; i < steps.size(); i++) {
Matcher matcher = Pattern.compile(portionMatcher).matcher(
steps.get(i).getDescription());
StringBuffer sb = new StringBuffer();
while (matcher.find()) {
printGroups(matcher);
String newValue1Str;
if (matcher.group(3) == null){
newValue1Str = "";
System.out.println("test");
}else{
double newValue1 = Integer.parseInt(matcher.group(3)) * multiplicator;
newValue1Str = Fraction.getFraction(newValue1).toProperString();
}
double newValue2 = Integer.parseInt(matcher.group(7)) * multiplicator;
String newValue2Str = Fraction.getFraction(newValue2).toProperString();
matcher.appendReplacement(sb, newValue1Str + "$4$5$6" + newValue2Str + "$8");
}
matcher.appendTail(sb);
steps.get(i).setDescription(sb.toString());
}
}
希望你能说出我错过了什么。
【问题讨论】:
-
究竟是什么不愉快的行为 - 你能更清楚地描述它吗?你需要那么多捕获组
()吗? -
因为组 2 到 7 应该为空。但是例如在第 3 组中,字符串“0”是初始字符串 190 的最后一位。即使整体匹配是我想要的。我真的不需要所有的组。但我需要得到第 3 组和第 7 组,我需要用它们计算一些东西,然后将计算值放在指定位置
-
@lugges:为什么你单独放置的正则表达式与代码中的正则表达式不同?
-
那是因为在我的原始代码中,我从不同的数组构建了正则表达式,并且我使用了 print 方法并将其作为常量放在这里。我在最初的帖子和我的代码中删除了°C 周围的圆括号。我还缺少另一个区别吗?
标签: java regex parsing matcher