【发布时间】:2022-02-17 18:52:24
【问题描述】:
我们在 AWS EKS 上部署了一个 kubernetes 集群,并且在 CoreDNS pod 上遇到间歇性超时,通常在大约 5 分钟内聚集成 5-15 个失败查询组。在集群中,所有查询都使用相同的主机名。
CoreDNS 吐出这样的日志:
[ERROR] plugin/errors: 2 example.com. A: read udp [coreDNSpodIP]:39068->172.16.0.2:53: i/o timeout
集群部署在 CIDR 为 172.16.0.0/16 的 VPC 中,但我无法确定 172.15.0.2 下的内容
它们不时出现,我们无法重现触发它们的事件,也无法与集群上的任何事件相关联。 coreDNS pod 工作正常,同时也很好地服务于其他查询。解决该行为的原因和解决方案可能是什么?
【问题讨论】:
标签: kubernetes dns coredns