【发布时间】:2013-08-31 18:04:35
【问题描述】:
有一些任意字符串,例如
hello hello hello I am I am I am your string string string string of strings
我能否以某种方式找到重复的子字符串由空格分隔(编辑)?在这种情况下,它将是“你好”、“我是”和“字符串”。
我一直在想这个问题,但我仍然找不到任何真正的解决方案。 我也阅读了一些关于这个主题的文章并找到了后缀树,但这可以帮助我,即使我需要找到每一个重复,例如重复次数高于两次?
如果是这样,是否有一些python库可以处理后缀树并对它们执行操作?
编辑:很抱歉我不够清楚。所以为了清楚起见 - 我正在寻找重复的子字符串,这意味着字符串中的序列,例如,就正则表达式而言,可以用 + 或 {} 通配符代替。所以如果我必须从列出的字符串中制作正则表达式,我会这样做
(hello ){3}(I am ){3}your (string ){4}of strings
【问题讨论】:
-
我是这么认为的。在发布此问题之前,我实际上已经阅读了该问题,但我没有想出任何想法,如何将解决方案转换为适合我的问题。
-
没错,我只关注我真正想要的输出。对此感到抱歉。
-
不确定您的意思是否类似于this,结果在命名组“结果”中。当然
of strings不见了…… -
@Hyperboreus
m I a不是重复的子字符串由空格分隔