【发布时间】:2010-12-13 14:49:13
【问题描述】:
我有一个允许用户评论照片的网站。 当然,用户会留下这样的 cmets:
'OMGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGG !!!!!!!!!!!!!!!'
或
'你成功了'
你懂的。
基本上,我想通过删除至少大部分多余的重复字符来缩短这些 cmets。 我确定有一种方法可以使用正则表达式来做到这一点。我只是想不通。
有什么想法吗?
【问题讨论】:
-
我认为这不是一个好的解决方案......这会将评论的语言学改变为作者不打算的东西。基本上他们的意图是愚蠢的,你会把它变成胡言乱语。例如,当有人说“booooo!”时你会把它变成“bo!”吗?数字呢?用户名?网址?
-
你最好从三个重复的字母开始缩短 - 双倍的字母在英语中都是常见的。
-
输入良好的愚蠢垃圾邮件仍然是愚蠢的垃圾邮件,只是稍微难以一目了然。
-
另请参阅此处,了解为什么这类事情可能不是一个好主意的一个笨拙示例:codinghorror.com/blog/2008/10/…
-
您将允许多少个重复字符(即“you suucckk”与“you sssuuucccckkk”与“you ssssuuuucccckkkk”)?或者像“LOLOLOLOLOLOLOLOLOL”或“s s s s u u u u c c c c c k k k k”这样的重复字符簇怎么样?