运维 K8s 集群的难点,可以分为哪两部分?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
难点 1:运维 K8s 集群的管控面l 如何支持用户一键弹出新的 Kubernetes 集群? (1)如何升级多个 K8s 集群的版本,当社区重大 CVE 发现时,是否要一个个升级集群? (2)如何自动修复多个 K8s 集群运行时发生的故障? 3)如何对集群的 etcd 进行维护,包括升级、备份、恢复、节点迁移? 难点 2:运维 Worker 节点 (1)如何快速扩缩容 Worker 节点?同时需要确保每个节点的 on-host 软件(例如 docker、kubelet 等无法被 K8s 托管的组件)版本、配置和其他节点拉齐。 (2)如何升级若干 Worker 节点上的 on-host 软件?如何灰度发布 Worker 节点上的软件包? (3)如何自动修复若干 Worker 节点可能出现的 on-host 软件故障?比如要是 docker/kubelet 发生panic,我们是否能自动化的处理?
答复内容摘自《云原生技术与架构实践年货小红书》,这本电子书收录开发者藏经阁 下载连接:https://developer.aliyun.com/topic/download?id=1127
阿里云拥有国内全面的云原生产品技术以及大规模的云原生应用实践,通过全面容器化、核心技术互联网化、应用 Serverless 化三大范式,助力制造业企业高效上云,实现系统稳定、应用敏捷智能。拥抱云原生,让创新无处不在。