K8S存储卷常见问题 - 云盘

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: K8S存储卷常见问题集锦

1. Pod挂载、卸载失败,日志中报Orphaned pod;

该问题为kubelet删除pod的bug,相关解决方法:链接

2. 卸载失败:

2.1. 云盘umount失败,有残留挂载点

【发生场景】:
创建集群时,worker节点挂载了数据盘作为docker、kubelet的存储盘;

在节点上:/var/lib/docker, /var/lib/kubelet挂载到/dev/vdb1上;

【现象】:
云盘无法从节点自动卸载,登陆节点发现,类似如下挂载点没有umount成功:

/dev/vdc on /var/lib/kubelet/plugins/kubernetes.io/flexvolume/alicloud/disk/mounts/d-2zefwuq9sv0gkxqrll5t type ext4 (rw,relatime,data=ordered)
/dev/vdc on /var/lib/container/kubelet/plugins/kubernetes.io/flexvolume/alicloud/disk/mounts/d-2zefwuq9sv0gkxqrll5t type ext4 (rw,relatime,data=ordered)

【解决办法】:
升级flexvolume到最新版本;

如果还有云盘仍然没有卸载,需要手动到节点上umount,然后到控制台卸载;

3. 挂载失败

3.1. 挂载出现timeout错误

如果节点为手动添加,可能是由于sts权限的问题导致,需要手动配置RAM权限:https://help.aliyun.com/document_detail/61175.html

3.2. 出现云盘 Size错误;

创建云盘对Size有如下要求,请检查;

普通云盘:最小5Gi;
高效云盘:最小20Gi;
SSD云盘:最小20Gi;

3.3. 出现zone错误;

ecs挂载云盘时,必须在同一个region下面的相同zone内,否则不能挂载成功;

3.4. 升级系统后,云盘有时报错:input/output error

1). 升级flexvolume到最新版本;:

2). 对于已经出问题的Pod,需要重建;

Flexvolume版本信息:https://yq.aliyun.com/articles/596314

3.5. 云盘pvname与diskid不同时报错

按照使用文档,需要把pvname配置与diskid相同,若您创建的云盘pv配置的名字与diskid不同时,参考以下步骤做到兼容:

1. pvname与diskid不同时,查看使用此pv的pod,并找到pod所在的节点;
2. 在对应的节点上创建目录:mkdir -p /etc/kubernetes/volumes/disk/remove,并创建以下文件:/etc/kubernetes/volumes/disk/pvnanme.conf,内容为diskid;

升级flexvolume到最新版本;

相关实践学习
容器服务Serverless版ACK Serverless 快速入门:在线魔方应用部署和监控
通过本实验,您将了解到容器服务Serverless版ACK Serverless 的基本产品能力,即可以实现快速部署一个在线魔方应用,并借助阿里云容器服务成熟的产品生态,实现在线应用的企业级监控,提升应用稳定性。
云原生实践公开课
课程大纲 开篇:如何学习并实践云原生技术 基础篇: 5 步上手 Kubernetes 进阶篇:生产环境下的 K8s 实践 相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
目录
相关文章
|
1月前
|
存储 Kubernetes 容器
K8s中Pod常见问题排查
K8s中Pod常见问题排查
20 6
|
2月前
|
Kubernetes Java 测试技术
ChaosBlade常见问题之在K8s环境下演练cpu满载报错如何解决
ChaosBlade 是一个开源的混沌工程实验工具,旨在通过模拟各种常见的硬件、软件、网络、应用等故障,帮助开发者在测试环境中验证系统的容错和自动恢复能力。以下是关于ChaosBlade的一些常见问题合集:
30 0
|
3天前
|
存储 Kubernetes 数据安全/隐私保护
|
12天前
|
存储 Kubernetes 调度
K8S常见的持久化(存储)方案用法详解
K8S常见的持久化(存储)方案用法详解
|
20天前
|
敏捷开发 存储 缓存
云效产品使用常见问题之通过vpc内网部署到ack失败如何解决
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
29天前
|
存储 运维 Kubernetes
Kubernetes存储卷
Kubernetes存储卷
30 0
|
1月前
|
存储 Kubernetes 容器
K8S中使用nfs作为存储卷
K8S中使用nfs作为存储卷
17 0
|
2月前
|
Kubernetes Java 测试技术
ChaosBlade常见问题之创建k8s node-cpu fullload 提示无法找到node如何解决
ChaosBlade 是一个开源的混沌工程实验工具,旨在通过模拟各种常见的硬件、软件、网络、应用等故障,帮助开发者在测试环境中验证系统的容错和自动恢复能力。以下是关于ChaosBlade的一些常见问题合集:
25 0
|
2月前
|
Kubernetes 测试技术 API
ChaosBlade常见问题之安装K8S探针心跳检测失败如何解决
ChaosBlade 是一个开源的混沌工程实验工具,旨在通过模拟各种常见的硬件、软件、网络、应用等故障,帮助开发者在测试环境中验证系统的容错和自动恢复能力。以下是关于ChaosBlade的一些常见问题合集:
27 0
|
2月前
|
Kubernetes Java Nacos
nacos常见问题之k8s上部署需要自动扩缩容如何解决
Nacos是阿里云开源的服务发现和配置管理平台,用于构建动态微服务应用架构;本汇总针对Nacos在实际应用中用户常遇到的问题进行了归纳和解答,旨在帮助开发者和运维人员高效解决使用Nacos时的各类疑难杂症。
37 0

相关产品

  • 容器服务Kubernetes版