编辑 2:回答 OP 新要求
ranges = []
for key, group in groupby(enumerate(data), lambda (index, item): index - item):
group = map(itemgetter(1), group)
if len(group) > 1:
ranges.append(xrange(group[0], group[-1]))
else:
ranges.append(group[0])
输出:
[xrange(2, 5), xrange(12, 17), 20]
您可以将 xrange 替换为 range 或任何其他自定义类。
Python 文档对此有一个非常简洁的recipe:
from operator import itemgetter
from itertools import groupby
data = [2, 3, 4, 5, 12, 13, 14, 15, 16, 17]
for k, g in groupby(enumerate(data), lambda (i,x):i-x):
print(map(itemgetter(1), g))
输出:
[2, 3, 4, 5]
[12, 13, 14, 15, 16, 17]
如果你想得到完全相同的输出,你可以这样做:
ranges = []
for k, g in groupby(enumerate(data), lambda (i,x):i-x):
group = map(itemgetter(1), g)
ranges.append((group[0], group[-1]))
输出:
[(2, 5), (12, 17)]
编辑:该示例已在文档中进行了解释,但也许我应该对其进行更多解释:
解决方案的关键是
与一个范围进行差分,使得
连续的数字都出现在同一个
组。
如果数据是:[2, 3, 4, 5, 12, 13, 14, 15, 16, 17]
那么groupby(enumerate(data), lambda (i,x):i-x) 等价于以下内容:
groupby(
[(0, 2), (1, 3), (2, 4), (3, 5), (4, 12),
(5, 13), (6, 14), (7, 15), (8, 16), (9, 17)],
lambda (i,x):i-x
)
lambda 函数从元素值中减去元素索引。因此,当您在每个项目上应用 lambda 时。您将获得 groupby 的以下键:
[-2, -2, -2, -2, -8, -8, -8, -8, -8, -8]
groupby 按相同的键值对元素进行分组,因此前 4 个元素将被组合在一起,依此类推。
我希望这使它更具可读性。
python 3版本可能对初学者有帮助
先导入需要的库
from itertools import groupby
from operator import itemgetter
ranges =[]
for k,g in groupby(enumerate(data),lambda x:x[0]-x[1]):
group = (map(itemgetter(1),g))
group = list(map(int,group))
ranges.append((group[0],group[-1]))