【发布时间】:2015-10-28 09:57:12
【问题描述】:
早上好,
我发现多个线程处理使用多个分隔符分割字符串,但不是一个分隔符和多个条件。
我想按句子分割以下字符串:
desc = Anna Pytlik 博士是保守和美学牙科方面的专家。她会说英语和波兰语。
如果我这样做:
[t.split('.') for t in desc]
我明白了:
['Dr','Anna Pytlik 是保守和美学牙科方面的专家','她会说英语和波兰语。']
我不想拆分“博士”之后的第一个点。如何添加子字符串列表,在这种情况下 .split('.') 不适用?
谢谢!
【问题讨论】:
-
编译/获取缩写列表并匹配它们。
-
这是一个XY problem,其中
X是“用多个分隔符分割字符串”,Y是“我想按句子分割以下字符串。 " 答案可能是nltk.sent_tokenize(text),例如Python: Finding The Longest/Shortest Sentence In A Random Paragraph?
标签: python regex python-2.7 split string-split