【发布时间】:2020-05-02 21:02:21
【问题描述】:
我正在寻找一些建议,如果有人能指出我正确的方向,我将永远感激不尽。
我有一个 docker 容器,用于跨视频帧集进行基于机器学习的对象检测/跟踪。目前,我用这个 docker 容器启动了一个 ec2 实例,然后以串行方式发送大约 30 帧的批次。当然,这太慢了。
我想建立一个 kubernetes 系统,它可以从零个运行容器到 50+,然后立即降到所需的最低限度。由于模型大小,每个容器需要大约 8 Gb 的 RAM,但可以在 CPU 上运行。我需要这些运行大约一分钟以并行处理传入的图像,然后终止,在视频处理完成后缩小到零活动容器。总之,将 30 帧的小批量发送到集群,使其大规模扩展,然后在完成后立即缩减。
我能够在 Google 云上设置一个 Kubernetes 集群,但我不知道如何在作业终止后将其快速扩展到零。在工作完成后运行这么多容器会非常昂贵。
有人能指出我正确的方向吗?我可以用 gke 做到这一点吗?我应该尝试其他服务吗?
非常感谢您的帮助。
没有
【问题讨论】:
标签: amazon-web-services azure kubernetes google-cloud-platform google-kubernetes-engine