【发布时间】:2021-02-13 07:46:17
【问题描述】:
我正在运行一个 GKE 集群,该集群有多个尝试访问共享卷的 pod。由于 GC 永久磁盘不允许 ReadWriteMany 访问,我在集群中设置了一个 NFS 服务器(与this 等许多示例所做的相同)以允许它。我在这个集群上以不同的命名空间运行生产环境和开发环境,但是由于这两个环境都运行同一个应用程序,它们都需要自己的文件系统。
目前,解决此问题的方法是以相同的方式设置 2 个 NFS 服务器(一个用于 prod,一个用于 dev)。似乎当使用 NFS 服务器挂载卷的 pod 与 NFS 服务器本身位于同一节点上时,它们无法挂载(错误是“无法附加或挂载卷 [...]:超时等待条件”)。但是,这似乎只发生在 dev 环境中,因为 prod 环境没有任何问题。目前,两台 NFS 服务器已分配到同一个节点,这也可能导致问题,但我不确定。
我一直试图弄清楚以这种方式拥有 2 个 NFS 服务器是否存在问题,或者尝试将 pod 连接到在同一节点上运行的 NFS 服务器是否存在问题,但无济于事迄今为止。有什么想法可能导致问题吗?
登录 nfs 服务器 pod(dev 和 prod 相同):
nfs-dev-server Oct 30, 2020, 3:57:23 PM NFS started
nfs-dev-server Oct 30, 2020, 3:57:22 PM exportfs: / does not support NFS export
nfs-dev-server Oct 30, 2020, 3:57:22 PM Starting rpcbind
nfs-dev-server Oct 30, 2020, 3:57:22 PM rpcinfo: can't contact rpcbind: : RPC: Unable to receive; errno = Connection refused
nfs-dev-server Oct 30, 2020, 3:57:21 PM Serving /
nfs-dev-server Oct 30, 2020, 3:57:21 PM Serving /exports
【问题讨论】:
-
NFS-server pod 中是否有日志?如果出现任何内容,您能否分享两个 pod 的输出,或者来自故障 nfs pod 的日志?
-
我已经添加了 NFS 服务器 pod 的日志,但是尽管有这些错误,它们通常似乎工作正常(至少在 NFS 方面,而不是上述问题)。 NFS pod 不是失败的,只是没有任何东西能够从同一个节点挂载到它们。
标签: kubernetes google-kubernetes-engine nfs