【发布时间】:2018-05-23 10:21:39
【问题描述】:
背景
我想使用带有 Inception-Resnet_v2 的 keras 预测病理图像。我已经训练了模型并得到了一个 .hdf5 文件。因为病理图像非常大(例如:20,000 x 20,000 像素),所以我必须扫描图像以获得小块进行预测。
我想使用带有 python2.7 的多处理库来加快预测过程。主要思想是使用不同的子进程扫描不同的行,然后将补丁发送到模型。
我看到有人建议在子进程中导入 keras 和加载模型。但我认为它不适合我的任务。使用keras.models.load_model()加载模型一次大约需要47s,非常耗时。所以每次启动新的子流程时,我都无法重新加载模型。
问题
我的问题是我可以在主进程中加载模型并将其作为参数传递给子进程吗?
我尝试了两种方法,但都没有奏效。
方法一。使用 multiprocessing.Pool
代码是:
import keras
from keras.models import load_model
import multiprocessing
def predict(num,model):
print dir(model)
print num
model.predict("image data, type:list")
if __name__ == '__main__':
model = load_model("path of hdf5 file")
list = [(1,model),(2,model),(3,model),(4,model),(5,model),(6,model)]
pool = multiprocessing.Pool(4)
pool.map(predict,list)
pool.close()
pool.join()
输出是
cPickle.PicklingError: Can't pickle <type 'module'>: attribute lookup __builtin__.module failed
我查错发现Pool can't map unpickelable parameters,所以我尝试方法2。
方法二。使用 multiprocessing.Process
代码是
import keras
from keras.models import load_model
import multiprocessing
def predict(num,model):
print num
print dir(model)
model.predict("image data, type:list")
if __name__ == '__main__':
model = load_model("path of hdf5 file")
list = [(1,model),(2,model),(3,model),(4,model),(5,model),(6,model)]
proc = []
for i in range(4):
proc.append(multiprocessing.Process(predict, list[i]))
proc[i].start()
for i in range(4):
proc[i].join()
在方法 2 中,我可以打印 dir(model)。我认为这意味着模型已成功传递给子流程。但是我得到了这个错误
E tensorflow/stream_executor/cuda/cuda_driver.cc:1296] failed to enqueue async memcpy from host to device: CUDA_ERROR_NOT_INITIALIZED; GPU dst: 0x13350b2200; host src: 0x2049e2400; size: 4=0x4
我使用的环境:
- Ubuntu 16.04,python 2.7
- keras 2.0.8(张量流后端)
- 一个 Titan X,驱动程序版本 384.98,CUDA 8.0
期待回复!谢谢!
【问题讨论】:
-
你解决过这个问题吗?在这里面临同样的酸洗问题。使用纯进程而不是池使进程挂起而不是无法腌制。但是我不确定这是否是一个进步。
标签: python-2.7 tensorflow multiprocessing keras