【发布时间】:2020-05-28 15:06:39
【问题描述】:
我正在尝试了解 Dask-ML 的 Client() 函数参数。假设我使用 Dask-ML 的 Client() 函数有以下代码:
from dask.distributed import Client
import joblib
client = Client()
如果我没有为Client()函数中的参数指定任何值,参数的默认值是什么:
(i)n_workers
(ii)threads_per_worker
(iii)memory_limit
据我了解,Python 具有阻止多线程的全局解释器锁 (GIL) 功能。如果是这样,为什么在Python中阻止多线程时,Dask-ML的Client()函数有参数threads_per_worker?
memory_limit 是指 每个 工人/机器/节点允许的最大内存限制,还是指 所有组合 工人/ 允许的最大内存限制机器/节点?
我已经查看了 Dask-ML 中的文档(请参阅此处:https://docs.dask.org/en/latest/setup/single-distributed.html),但对于上述这些问题,文档并不清楚。
如果有人能解释一下,请提前谢谢你?
【问题讨论】:
标签: python memory memory-management dask dask-distributed