【发布时间】:2015-08-29 17:33:36
【问题描述】:
我有一个包含很多人名的文本文件:
- 阿贝琳德,小埃利索。 DELA PEÑA
- 德拉克鲁兹,弗朗西亚德拉罗萨
- 德耶稣,阿尔玛西诺巴
- 史密斯,约翰·保罗·西诺巴
- 阿博尔多,艾玛·德拉托雷
- ABORDO,杰温·德洛斯·雷耶斯
- ABAO,贾恩德洛斯雷耶斯
DELOS REYES、DE LA TORRE 和 DELA PEÑA 是中间名。
如果姓氏和名字中间名仅包含单个值,我可以毫无问题地使用split() 放入数组。当第二部分是多个名字或有多个姓氏或有后缀时,我遇到了困难。我怎样才能得到这些名字?
【问题讨论】:
-
请添加一些您对预期结果有疑问的示例数据;)。
-
我不认为你会解决它,如果你的文件中的数据没有被格式化成你可以识别中间名开始和结束的方式,那就很难分辨了。
-
西班牙名字通常不包含中间名
-
这些是菲律宾人的名字。
-
您(作为人类)使用哪些确切规则来找出名字的结尾和中间名的开头?清楚明确地说明它们,然后我们可以帮助您将它们翻译成代码。