【问题标题】:Azure aks no nodes foundAzure 没有找到节点
【发布时间】:2018-07-15 07:50:50
【问题描述】:

我创建了一个具有 3 个节点的 azure AKS(标准 DS3 v2(4 vcpus,14 GB 内存))。我正在摆弄集群并创建了一个包含 1000 个副本的部署。在这个完整的集群出现故障之后。

azureuser@saa:~$ k get cs
NAME                 STATUS      MESSAGE                                                                                        ERROR
controller-manager   Unhealthy   Get http://127.0.0.1:10252/healthz: dial tcp 127.0.0.1:10252: getsockopt: connection refused   
scheduler            Unhealthy   Get http://127.0.0.1:10251/healthz: dial tcp 127.0.0.1:10251: getsockopt: connection refused   
etcd-0               Healthy     {"health": "true"}  

从调试来看,Scheduler 和 Controller-manager 似乎都出现了故障。如何解决这个问题?

在创建具有 1000 个副本的部署时究竟发生了什么?是否应该被 k8s 照顾?

少量调试命令输出:

  kubectl cluster-info
    Kubernetes master is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443
    Heapster is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443/api/v1/namespaces/kube-system/services/heapster/proxy
    KubeDNS is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443/api/v1/namespaces/kube-system/services/kube-dns:dns/proxy
    kubernetes-dashboard is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443/api/v1/namespaces/kube-system/services/kubernetes-dashboard/proxy

kubectl cluster-info dump@http://termbin.com/e6wb 的日志

azureuser@sim:~$ az aks scale -n cg -g cognitive-games -c 4 --verbose
Deployment failed. Correlation ID: 4df797b2-28bf-4c18-a26a-4e341xxxxx. Operation failed with status: 200. Details: Resource state Failed

没有显示节点

azureuser@si:~$ k get nodes
No resources found

【问题讨论】:

  • 嗨,您使用的是 AKS,这意味着 Kubernetes 主服务器由 Azure 管理。在上述场景中,调度程序和控制器管理器没有关闭。你可以看到它说连接被拒绝
  • 您可以使用kubectl get events查看更多信息
  • @SureshVishnoi kubectl get eventsNo resources found
  • 您好,集群已启动。我们需要获取节点或整个集群的日志来诊断问题。你可以运行kubectl cluster-info
  • @SureshVishnoi 更新了所需的日志

标签: azure kubernetes azure-aks


【解决方案1】:

看起来很傻,但是当在 RG 中创建 AKS 时,令人惊讶的是,会创建两个 RG,一个带有 AKS,另一个带有一些具有所有 VMS 的随机散列。我已经删除了第二个 RG 并且基本的 AKS 停止工作。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-09-29
    • 2014-07-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-06-06
    • 2011-01-13
    • 1970-01-01
    相关资源
    最近更新 更多