【问题标题】:Reloading a Python module per process in the multiprocessing module在多处理模块中为每个进程重新加载 Python 模块
【发布时间】:2017-02-23 09:17:01
【问题描述】:

有没有办法在使用 Python 的多处理模块创建的进程中加载​​每个进程的模块副本?我试过这个:

def my_fn(process_args):
    import my_module
    my_func()

...但是 my_module 中的子导入会一劳永逸地加载和缓存。特别是,其中一个子导入读取一个配置文件,其值是根据第一个进程的环境设置的。如果我试试这个:

def my_fn(process_args):
    try:
        my_module = reload(my_module)
    except NameError:
        import my_module

...my_module 的子导入不会重新加载。

【问题讨论】:

标签: python python-multiprocessing python-module


【解决方案1】:

您可以尝试通过检查要重新加载的模块并重新加载它使用的任何模块来实现深度重新加载功能。这不是万无一失的,例如不会处理类似的事情:

class MyClass:
    module = import_module('amodule')

但对于您的目的来说已经足够了。

mymod.py

# Example submodule to re-import
print('import module mymod')

# demonstrate we can even import test as a module and it works
import sys
from test import deep_reload_module

value = 2

def a_function():
    pass

class XYZ:
    pass

class NewClass(object):
    pass

test.py

import importlib
import sys
import mymod


def deep_reload_module(name):

    mod = sys.modules.get(name)
    if not mod:
        importlib.import_module(name)
        return

    def get_mods_to_reload_recursively(name, modules_to_reload=None):
        modules_to_reload = modules_to_reload or set()
        mod = sys.modules[name]
        modules_to_reload.add(name)

        # loop through the attributes in this module and remember any
        # submodules we should also reload
        for attr in dir(mod):
            prop = getattr(mod, attr)
            if isinstance(prop, type(mymod)):
                modname = attr
            elif hasattr(prop, '__module__'):
                modname = prop.__module__
                if not modname:
                    continue
            else:
                # this thing is not a module nor does it come from another
                # module, so nothing to reimport.
                continue

            if modname in sys.builtin_module_names:
                # probably best not to reimport built-ins...
                continue

            if modname in modules_to_reload:
                # this is already marked for reimporting, so avoid infinite
                # recursion
                continue

            # get_mods_to_reload... will update modules_to_reload so no need to
            # catch the return value
            get_mods_to_reload_recursively(modname, modules_to_reload)

        return modules_to_reload

    mods_to_reload = get_mods_to_reload_recursively(name)
    for mtr in mods_to_reload:
        # best to delete everything before reloading so that you are
        # sure things get re-hooked up properly to the new modules.
        print('del sys.modules[%s]' % (mtr,))
        del sys.modules[mtr]

    importlib.import_module(name)


if __name__ == '__main__':
    orig_mymod_id = id(sys.modules['mymod'])
    deep_reload_module('mymod')
    assert orig_mymod_id != id(sys.modules['mymod'])

然后,您只需在新进程启动时调用deep_reload_module('module'),或者在每个多处理作业开始时更轻松。

注意:这在很大程度上依赖于您要重新导入的模块之外的代码,而您之前没有从该模块导入任何内容,因为如果有,那么该代码将继续使用旧的模块或中断。

例如如果您有执行此操作的代码:

from module_to_reimport import a_function

但没有在任何地方显式保留module_to_reimport,那么在重新导入模块后调用a_function 很可能会失败,因为它只维护对module_to_reimport 中定义的globals() 的弱引用,这些将删除sys.modules中的模块,全军覆没。

【讨论】:

    【解决方案2】:

    将一个函数放入my_module,例如:

    def my_realod():
    try:
        my_sub_module = reload(my_sub_module)
    except NameError:
        import my_sub_module  
    

    像这样拨打my_reload

    def my_fn(process_args):
    try:
        my_module = reload(my_module)
        my_module.my_reload()
    
    except NameError:
        import my_module
    

    【讨论】:

      猜你喜欢
      • 2014-11-21
      • 2012-10-19
      • 1970-01-01
      • 1970-01-01
      • 2011-04-04
      • 2017-12-11
      • 1970-01-01
      • 2013-05-16
      • 2015-02-07
      相关资源
      最近更新 更多