【发布时间】:2012-07-08 11:55:53
【问题描述】:
这是我的问题:我有一个大字符串(近 8000 个字符),我想要两件事:
- 检测句子边界,如“.”和
- 句子长度不超过 600 个字符
我知道在某些情况下不可能两者兼得。在这种情况下,找到一个空格并拆分句子。
ridgerunner 为条件号 1 提供的这个解决方案非常有效,请参阅原始链接 (http://goo.gl/PqI6d),但它通常输出大于 600 个字符的句子.有光吗??提前致谢!
【问题讨论】:
-
检查这个正则表达式是否是你想要的:
/(?:[^.]{1,20}(?: |\.)|\w{20,}(?: |\.)?)/。您可以将20更改为600以适合您的情况。测试用例:This is a short sentence. This is a very very very very very very long long long long long long sentence. Andthisisaverylongwordwithoutspaces.
标签: php regex size boundary sentence