共计 1375 个字符,预计需要花费 4 分钟才能阅读完成。
这篇文章主要介绍“kubernetes 高可用集群升级的 etcd 错误怎么解决”,在日常操作中,相信很多人在 kubernetes 高可用集群升级的 etcd 错误怎么解决问题上存在疑惑,丸趣 TV 小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”kubernetes 高可用集群升级的 etcd 错误怎么解决”的疑惑有所帮助!接下来,请跟着丸趣 TV 小编一起来学习吧!
使用 kubeadm 创建的 kubernetes 高可用集群升级时出现 etcd 访问错误,手工删除 etcd 中的错误节点信息后升级成功。
正常情况 kubernetes 升级使用下面的命令来完成:
sudo kubeadm upgrade plan
然后按照提示操作即可。
1、出现 etcd 访问错误
但这一次,出线了错误:
etcd.go:480] Failed to get etcd status
经检查,是 etcd 的第一个节点(kubenetes 的 master 之一)无法访问。
2、从集群删除节点
删除该节点:
kubectl delete node podc01
然后问题仍然存在。经查,被删除节点的 etcd 服务地址仍然在集群中,而且不可访问,升级无法完成。
根据网上的 kubeadm 说明,使用 kubeadm reset 将会自动删除 etcd 的节点信息。
但是,kubeadm reset 后,经查,被删除节点的 etcd 服务地址仍然在集群中,而且不可访问,升级无法完成。
3、手动删除 etcd node
查看并手动删除 etcd node 信息:
alias etcdv3= ETCDCTL_API=3 etcdctl --endpoints=https://[10.1.1.202]:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=/etc/kubernetes/pki/etcd/peer.crt --key=/etc/kubernetes/pki/etcd/peer.key
因为 etcd 的命令较长,先用个别名简化一下。
将上面的 10.1.1.202 改为自己的可用 master 节点 IP 地址。
更多 etcd 使用指南,可参考:
Kubernetes 的 etcd 多节点扩容实战技巧
Kubernetes 探秘 -etcd 节点和实例扩容
Kubernetes 的 etcd 数据查看和迁移
Kubernetes 探秘—etcd 状态数据及其备份
然后,运行:
# 查看 etcd 集群的成员:etcdv3 member list
#删除 etcd 集群的不可访问的成员:etcdv3 member remove XXXXXXXXXX
#再次查看 etcd 集群的成员:etcdv3 member list
然后,再来运行 Kubernetes 升级命令:
# 检查升级状态。sudo kubeadm upgrade plan
#直接升级到 Kubernetes 1.18.1 版本。#!可能需要将镜像预先部署到所有节点上。sudo kubeadm upgrade apply v1.18.2
升级成功。
到此,关于“kubernetes 高可用集群升级的 etcd 错误怎么解决”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注丸趣 TV 网站,丸趣 TV 小编会继续努力为大家带来更多实用的文章!