【问题标题】:Synchronization of writing to shared memory (list) in Python multiprocessingPython多处理中写入共享内存(列表)的同步
【发布时间】:2019-05-10 20:18:46
【问题描述】:

我有以下代码:

import multiprocessing
manager = multiprocessing.Manager()

如果列表长度小于 4,则追加列表或创建一个初始值为 'y' 的新列表的函数。

def f(my_array):
    if len(my_array) < 4:
        my_array.append('x')
    else:
        my_array = ['y']
    print(my_array)

初始化列表和创建进程。

if __name__ == '__main__':
    my_array = manager.list(['a', 'b', 'c'])

    p1 = Process(target=f, args=(my_array))
    p2 = Process(target=f, args=(my_array))
    p3 = Process(target=f, args=(my_array))
    p4 = Process(target=f, args=(my_array))
    p5 = Process(target=f, args=(my_array))

    p1.start()
    p2.start()
    p3.start()
    p4.start()
    p5.start()

    p1.join()
    p2.join()
    p3.join()
    p4.join()
    p5.join()

我得到的输出:

['a', 'b', 'c', 'x']
['y']
['y']
['y'] 
['y']

我不明白为什么列表只附加一次。我希望在第三个输出行中我会观察到列表 ['y'] 附加了 'x',所以 ['y', 'x'],第四个 ['y', 'x', 'x']等等。似乎共享内存泄漏或不允许通过多个进程的函数进行更改。我可以做些什么来启用目标行为?

【问题讨论】:

    标签: python multiprocessing shared-memory python-multiprocessing multiprocessing-manager


    【解决方案1】:

    同步是您的示例中缺少的一点。 manager.list 只是一个单独的服务器进程中的普通list,您的工作进程可以通过代理对象进行修改。您的进一步处理恰好同时检查len(my_array)

    没有同步,这告诉他们应该等到另一个进程完成它的操作,包括执行此长度检查并执行取决于此检查结果的操作。您的更新操作不是原子操作,您需要通过在操作周围使用 manager.lock 来使其成为一个。

    您的代码中还有另一个问题,您重新绑定my_array 以指向普通列表['y'],而不是更新/修改共享manager.list。您没有使用设置my_array = ['y'] 的进程来修改manager.listmanager.list 从第一次修改到第一个工作进程直到程序结束都保持它的值['a', 'b', 'c', 'x']

    from multiprocessing import Process, Manager
    
    
    def f(my_array, lock):
        with lock:
            if len(my_array) < 4:
                my_array.append('x')
            else:
                my_array[:] = []  # clear list inplace by assigning
                # empty list to slice of manager.list
                my_array.append('y')
        print(my_array)
    
    
    if __name__ == '__main__':
    
        N_WORKERS = 5
    
        with Manager() as manager:
    
            my_array = manager.list(['a', 'b', 'c'])
            lock = manager.Lock()
    
            pool = [
                Process(target=f, args=(my_array, lock)) for _ in range(N_WORKERS)
            ]
    
            for p in pool:
                p.start()
            for p in pool:
                p.join()
    
            # Leaving the context-manager block will shut down the manager-process.
            # We need to convert the manager-list to a normal list in the parent
            # to keep its values available for further processing in the parent.
            result = list(my_array)
    
        print(f'result: {result}')
    

    示例输出:

    ['a', 'b', 'c', 'x']
    ['y']
    ['y', 'x']
    ['y', 'x', 'x']
    ['y', 'x', 'x', 'x']
    result: ['y', 'x', 'x', 'x']
    
    Process finished with exit code 0
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2015-03-15
      • 1970-01-01
      • 2017-01-02
      • 2013-08-19
      • 2012-12-16
      • 2021-02-22
      • 2023-04-06
      • 2014-01-11
      相关资源
      最近更新 更多