【发布时间】:2014-12-29 11:10:01
【问题描述】:
我有这个长字符串(它是一个长而连续的字符串):
Home address H.NO- 12 SECTOR- 12 GAUTAM BUDH NAGAR NOIDA- 121212, UTTAR PRADESH INDIA +911112121212 Last Updated: 12-JUN-12 Semester/Term-time Accommodation Type: Hall of residence (private provider) Semester/Term-time address A121A SOME APPARTMENT SOME LANE CITY COUNTY OX3 7FJ +91 1212121212 Last Updated: 12-SEP-12 Mobile Telephone Number : 01212121212
如果你看上面的字符串,可以产生以下模式:
<home_address_text><space><the_address><space><last_updated_text><last_updated_date><space><accomodation_type_text><accomodation_type><space><semester_time_address_text><semester_time_address><space>last_updated_text><last_updated_date><space><mobile_number_text><mobile_number>
我想提取此字符串的特定部分,例如:
1. H.NO- 12 SECTOR- 12 GAUTAM BUDH NAGAR NOIDA- 121212, UTTAR PRADESH INDIA
2. Hall of residence (private provider)
3. A121A SOME APARTMENT SOMELANE CITY COUNTY OX3 7FJ
4. 01212121212
这个信息是可变的,所以它因人而异,所以我不能只计算长度并使用子字符串来提取它,因为整个字符串的长度&我要提取的部分是可变的。
如上所述,如何使用 Java 提取字符串的特定部分?很久以来我一直在寻找方法,但找不到方法。任何帮助将不胜感激
【问题讨论】:
-
您需要更好地解释输入数据格式。鉴于您似乎在暗示什么,可能没有一个好的方法来做到这一点。我希望你每行有一个条目,否则这几乎是不可能的。
-
@markspace 输入是一个字符串
-
用一个例子很难找到一个模式(在广泛的主线中)。
-
@coderrio 这不是答案。
-
这个字符串有什么规律?你能描述一下它的模式/格式吗?
标签: java regex string substring