【发布时间】:2019-02-06 04:29:48
【问题描述】:
我有一个用例,其中前端应用程序将文件发送到后端服务进行处理。并且后端服务 pod 一次只能处理一个请求。如果有多个请求,服务应该自动缩放并将该请求发送到新的 Pod。 因此,我正在寻找一种方法,可以针对每个请求生成一个新的 POD,并且在后端服务 pod 完成处理后,它将结果返回给前端服务并自行销毁。 这样每个 pod 一次只处理一个请求。
我探索了 HPA 自动缩放,但没有找到任何合适的方法。 开放使用任何自定义指标服务器,如果他们能够满足上述场景,甚至可以使用 Jobs。
因此,如果有人了解或处理相同的用例,请帮助我,以便我也可以尝试该解决方案。 提前致谢。
【问题讨论】:
-
谢谢两位。但是还有一个问题,即使使用某个 HPA 或服务帐户创建一个新的可用 pod,即使那样我们也不能保证通过使用后端服务名称它会重定向到该可用 pod,因为服务会自动执行负载平衡。除非我们在前端使用新的 pod IP 代替服务名称来代替服务名称进行调用。请求可以去任何地方。
标签: kubernetes kubernetes-helm horizontal-scaling amazon-eks