【问题标题】:Generator to yield gap tuples from zipped iterables生成器从压缩的迭代中产生间隙元组
【发布时间】:2014-10-31 16:05:00
【问题描述】:

假设我有任意数量的可迭代对象,所有这些都可以假定是已排序的,并且包含所有相同类型的元素(整数,为了便于说明)。

a = (1, 2, 3, 4, 5)
b = (2, 4, 5)
c = (1, 2, 3, 5)

我想编写一个生成器函数,产生以下结果:

(1, None, 1)
(2, 2, 2)
(3, None, 3)
(4, 4, None)
(5, 5, 5)

换句话说,逐步产生带有间隙的排序元组,其中输入迭代中缺少元素。

【问题讨论】:

  • 使用列表存储当前值有什么问题?
  • 如果 all 输入迭代中缺少一个元素,您是否需要以某种方式检测?
  • 如果所有元素都缺失,那么不,不需要检测。换句话说,永远不要返回(None, None, None)
  • 由于性能原因,在这种情况下必须避免使用列表 - 事物不应全部保存在内存中,而应一次处理一个。
  • 好吧,下面的建议有效:)

标签: iterator generator python-2.6


【解决方案1】:

我对此的看法,只使用迭代器,而不是堆:

a = (1, 2, 4, 5)
b = (2, 5)
c = (1, 2, 6)
d = (1,)
inputs = [iter(x) for x in (a, b, c, d)]

def minwithreplacement(currents, inputs, minitem, done):
    for i in xrange(len(currents)):
        if currents[i] == minitem:
            try:
                currents[i] = inputs[i].next()
            except StopIteration:
                currents[i] = None
                done[0] += 1
            yield minitem
        else:
            yield None

def dothing(inputs):
    currents = [it.next() for it in inputs]
    done = [0]
    while done[0] != len(currents):
        yield minwithreplacement(currents, inputs, min(x for x in currents if x), done)

print [list(x) for x in dothing(inputs)] #Consuming iterators for display purposes
>>>[[1, None, 1, 1], [2, 2, 2, None], [4, None, None, None], [5, 5, None, None], [None, None, 6, None]]

【讨论】:

    【解决方案2】:

    我们首先需要heapq.merge 的变体,它也会产生索引。您可以通过复制粘贴 heapq.merge 并将每个 yield v 替换为 yield itnum, v 来获得它。 (为了便于阅读,我从答案中省略了那部分)。

    现在我们可以这样做了:

    from collections import deque, OrderedDict
    
    def f(*iterables):
        pending = OrderedDict()
        for i, v in merge(iterables):
            if (not pending) or pending.keys()[-1] < v:
                # a new greatest value
                pending[v] = [None] * len(iterables)
            pending[v][i] = v
            # yield all values smaller than v
            while len(pending) > 1 and pending.keys()[0] < v:
                yield pending.pop(pending.keys()[0])
        # yield remaining
        while pending:
            yield pending.pop(pending.keys()[0])
    
    print list(f((1,2,3,4,5), (2,4,5), (1,2,3,5)))
    => [[1, None, 1], [2, 2, 2], [3, None, 3], [4, 4, None], [5, 5, 5]]
    

    【讨论】:

      猜你喜欢
      • 2014-09-17
      • 1970-01-01
      • 1970-01-01
      • 2019-11-15
      • 2018-05-16
      • 2016-06-26
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多