【发布时间】:2014-08-22 03:47:24
【问题描述】:
我有一个这样的 HTML 字符串(德语):
<li>Peter Goldberg Dr. , Brünner Straße 19, A-1210, Tel +43-1-1234567 (N)</li>
它由三部分组成:
- 人名(“Peter Goldberg 博士”)
- 此人的地址(“Brünner Straße 19, A-1210”)
- 以及此人的电话号码或字符串的其余部分(“Tel +43-1-1234567 (N)”)
我需要将整个字符串拆分为这 3 个组件,不带 HTML 列表标签 <li> 和 </li>。
我正在尝试使用 Pattern 和 Matcher 类,但我肯定做错了什么。
Pattern myPattern = Pattern.compile("<li>.+,.+Tel.+</li>");
Matcher mat = myPattern.matcher(eingabe[0]);
while (mat.find()) {
System.out.println(mat.group(0));
}
有人可以帮忙吗?
非常感谢!!
【问题讨论】:
-
答案将告诉您如何从特定字符串中获取这些特定字段,但那又如何?大多数正则表达式都用于其他输入字符串,仅举一个例子就会留下很多问题没有答案。地址中间总是只有一个逗号吗?或者它可以有0个或2个或更多?电话号码总是以
Tel开头吗?此人的姓名或电话号码中可以包含逗号吗?根据这些问题的答案,发布的答案可能不正确。