【发布时间】:2014-03-06 20:38:12
【问题描述】:
我有一个必须运行 12 次的 python 函数。我目前已设置为使用多处理库中的 Pool 来并行运行所有这些库。通常我一次运行 6 个,因为该函数是 CPU 密集型的,并且并行运行 12 个通常会导致程序崩溃。当我们一次做 6 个时,在前 6 个过程全部完成之前,第二组 6 个不会开始。理想情况下,我们希望在最初一批 6 个中的一个完成后立即启动另一个(例如第 7 个)——这样 6 个同时运行,同时还有更多的启动。现在代码看起来像这样(它会被调用两次,将前 6 个元素传递到一个列表中,然后将第二个 6 传递到另一个列表中:
from multiprocessing import Pool
def start_pool(project_list):
pool = Pool(processes=6)
pool.map(run_assignments_parallel,project_list[0:6])
所以我一直在尝试实施工作人员/队列解决方案并遇到了一些问题。我有一个看起来像这样的工作函数:
def worker(work_queue, done_queue):
try:
for proj in iter(work_queue.get, 'STOP'):
print proj
run_assignments_parallel(proj)
done_queue.put('finished ' + proj )
except Exception, e:
done_queue.put("%s failed on %s with: %s" % (current_process().name, proj, e.message))
return True
而调用worker函数的代码如下:
workers = 6
work_queue = Queue()
done_queue = Queue()
processes = []
for project in project_list:
print project
work_queue.put(project)
for w in xrange(workers):
p = Process(target=worker, args=(work_queue, done_queue))
p.start()
processes.append(p)
work_queue.put('STOP')
for p in processes:
p.join()
done_queue.put('STOP')
for status in iter(done_queue.get, 'STOP'):
print status
project_list 只是需要在函数“run_assignments_parallel”中运行的 12 个项目的路径列表。
按照现在的编写方式,同一进程(项目)多次调用该函数,我无法确定发生了什么。这段代码基于我找到的一个例子,我很确定循环结构搞砸了。任何帮助都会很棒,我为我对此事的无知表示歉意。谢谢!
【问题讨论】:
-
好吧,如果你有 indetation,你会得到错误,请检查一下
-
pxl 修复了明显的格式,但鉴于所有其他行都是正确的 - put('SOP') 与 Python 文档示例不符