kubernetes高可用集群升级的etcd错误怎么解决

57次阅读
没有评论

共计 1375 个字符,预计需要花费 4 分钟才能阅读完成。

这篇文章主要介绍“kubernetes 高可用集群升级的 etcd 错误怎么解决”,在日常操作中,相信很多人在 kubernetes 高可用集群升级的 etcd 错误怎么解决问题上存在疑惑,丸趣 TV 小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”kubernetes 高可用集群升级的 etcd 错误怎么解决”的疑惑有所帮助!接下来,请跟着丸趣 TV 小编一起来学习吧!

使用 kubeadm 创建的 kubernetes 高可用集群升级时出现 etcd 访问错误,手工删除 etcd 中的错误节点信息后升级成功。

正常情况 kubernetes 升级使用下面的命令来完成:

sudo kubeadm upgrade plan

然后按照提示操作即可。

1、出现 etcd 访问错误

但这一次,出线了错误:

etcd.go:480] Failed to get etcd status

经检查,是 etcd 的第一个节点(kubenetes 的 master 之一)无法访问。

2、从集群删除节点

删除该节点:

kubectl delete node podc01

然后问题仍然存在。经查,被删除节点的 etcd 服务地址仍然在集群中,而且不可访问,升级无法完成。

根据网上的 kubeadm 说明,使用 kubeadm reset 将会自动删除 etcd 的节点信息。

但是,kubeadm reset 后,经查,被删除节点的 etcd 服务地址仍然在集群中,而且不可访问,升级无法完成。

3、手动删除 etcd node

查看并手动删除 etcd node 信息:

alias etcdv3= ETCDCTL_API=3 etcdctl --endpoints=https://[10.1.1.202]:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=/etc/kubernetes/pki/etcd/peer.crt --key=/etc/kubernetes/pki/etcd/peer.key

因为 etcd 的命令较长,先用个别名简化一下。

将上面的 10.1.1.202 改为自己的可用 master 节点 IP 地址。

更多 etcd 使用指南,可参考:

Kubernetes 的 etcd 多节点扩容实战技巧

Kubernetes 探秘 -etcd 节点和实例扩容

Kubernetes 的 etcd 数据查看和迁移

Kubernetes 探秘—etcd 状态数据及其备份

然后,运行:

# 查看 etcd 集群的成员:etcdv3 member list
#删除 etcd 集群的不可访问的成员:etcdv3 member remove XXXXXXXXXX
#再次查看 etcd 集群的成员:etcdv3 member list

然后,再来运行 Kubernetes 升级命令:

# 检查升级状态。sudo kubeadm upgrade plan
#直接升级到 Kubernetes 1.18.1 版本。#!可能需要将镜像预先部署到所有节点上。sudo kubeadm upgrade apply v1.18.2

升级成功。

到此,关于“kubernetes 高可用集群升级的 etcd 错误怎么解决”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注丸趣 TV 网站,丸趣 TV 小编会继续努力为大家带来更多实用的文章!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-08-16发表,共计1375字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)