【发布时间】:2014-03-23 10:37:48
【问题描述】:
我正在尝试了解正则表达式以及如何使用它将包含段落的字符串拆分为句子。
编辑:如果我有文字:
Hello, my name is Mr. Bob. I am 15.2 months old. Can you believe that? No... Oh well.
我想让它变成
Hello, my name is Mr. Bob.
I am 15.2 months old.
Can you believe that?
No... Oh well.
【问题讨论】:
-
您的问题是什么?我没有看到,请具体说明。
-
那么有哪些标题呢? Mr. Mrs. Ms., Dr. Md. M.D., PA。 ... 什么标点符号应该结束一个句子?看起来像一个兔子洞,而且绝对不是为正则表达式量身定制的。
-
我不想使用 NLTK,但经过一些研究,我相信它更适合这项任务。标点符号如? !或句号。头衔列表不用太深,常见的 Mr. Mrs. Dr. Miss. Ms.
标签: python regex string python-2.7