【发布时间】:2015-12-13 08:34:51
【问题描述】:
我正在寻找一个匹配前两个字母等于后两个字母的单词的正则表达式。一个例子可以阐明需求。
给定以下文本:
渡渡鸟是最强壮的鸟类之一。受过教育的白蚁可能会学习如何操作留声机,但这不太可能。我觉得包含岩浆的汞合金会启发爸爸。
我怎样才能得到这个输出:
answer = [('dodo', 'do'), ('sturdiest', 'st'), ('educated', 'ed'),
('termite', 'te'), ('phonograph', 'ph'),
('sense', 'se'), ('amalgam', 'am'), ('magma', 'ma'),
('enlighten', 'en')]
如您所见,前 2 个字符与最后 2 个字符相同。
我的想法是过滤任何长度为 4 个或更多字符的单词,并且单词的前 2 个字符与后两个字符匹配。
到目前为止,我最多可以使用 4 个或更多字符的单词。
[A-Za-z]{4,}
我不需要完整的程序,我只需要正则表达式。
【问题讨论】: