【发布时间】:2018-05-10 13:50:06
【问题描述】:
设置
我有一串名字需要分成一个列表。
关注this answer,我有,
string = 'KreuzbergLichtenbergNeuköllnPrenzlauer Berg'
re.findall('[A-Z][a-z]*', string)
最后一行给我的地方,
['Kreuzberg', 'Lichtenberg', 'Neuk', 'Prenzlauer', 'Berg']
问题
1) 空格被忽略
“Prenzlauer Berg”实际上是 1 个名称,但代码根据“split-at-capital-letter”规则进行拆分。
如果前面的字符是空格,确保它不在大写字母处拆分的命令是什么?
2) 特殊字符处理不好
使用的代码无法处理'ö'。如何包含此类“德语”字符?
即我想获得,
['Kreuzberg', 'Lichtenberg', 'Neukölln', 'Prenzlauer Berg']
【问题讨论】:
标签: python string split whitespace