【发布时间】:2020-05-05 00:28:26
【问题描述】:
是否有在 Kubernetes 中为数百个机器学习模型提供服务的建议方法? 像Kfserving 这样的解决方案似乎更适合有一个经过训练的模型或其几个版本的情况,并且该模型可以满足所有请求。例如,对所有用户通用的 typeahead 模型。
但是是否有建议的方式来为数百或数千个此类模型提供服务?例如,专门针对每个用户的数据进行训练的 typeahead 模型。
实现这样的事情最简单的方法是,每个预先输入的服务容器在内存中维护一个本地模型缓存。但是随后扩展到多个 pod 将是一个问题,因为每个缓存都是 pod 的本地缓存。因此,每个请求都需要路由到已加载模型的正确 pod。
还必须维护这样一个注册表,以便我们知道哪个 pod 加载了哪个模型并在模型驱逐时执行更新似乎需要做很多工作。
【问题讨论】:
标签: machine-learning kubernetes knative-serving