Kubernetes 日常故障解决

2022-08-11 697

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Kubernetes 日常故障解决

Kubernetes 日常故障解决

问题 1：K8S 集群服务访问失败？

网络异常，图片无法展示

原因分析：证书不能被识别，其原因为：自定义证书，过期等。

解决方法：更新证书即可。

问题 2：K8S 集群服务访问失败？

curl: (7) Failed connect to 10.103.22.158:3000; Connection refused

原因分析：端口映射错误，服务正常工作，但不能提供服务。

解决方法：删除 svc，重新映射端口即可。

kubectl delete svc nginx-deployment

问题 3：K8S 集群服务暴露失败？

Error from server (AlreadyExists): services "nginx-deployment" already exists

原因分析：该容器已暴露服务了。

解决方法：删除 svc，重新映射端口即可。

问题 4：外网无法访问 K8S 集群提供的服务？

原因分析：K8S 集群的 type 为 ClusterIP，未将服务暴露至外网。

解决方法：修改 K8S 集群的 type 为 NodePort 即可，于是可通过所有 K8S 集群节点访问服务。

kubectl edit svc nginx-deployment

问题 5：pod 状态为 ErrImagePull？

readiness-httpget-pod   0/1     ErrImagePull   0          10s

网络异常，图片无法展示

原因分析：image 无法拉取；

网络异常，图片无法展示

解决方法：更换镜像即可。

问题 6：创建 init C 容器后，其状态不正常？

NAME READY STATUS RESTARTS AGEmyapp-pod 0/1 Init:0/2 0 20s

原因分析：查看日志发现，pod 一直出于初始化中；然后查看 pod 详细信息，定位 pod

创建失败的原因为：初始化容器未执行完毕。

Error from server (BadRequest): container "myapp-container" in pod "myapp-pod" is waiting to start: PodInitializing

网络异常，图片无法展示

waiting for myservice
Server: 10.96.0.10Address: 10.96.0.10:53
** server can't find myservice.default.svc.cluster.local: NXDOMAIN
*** Can't find myservice.svc.cluster.local: No answer*** Can't find myservice.cluster.local: No answer*** Can't find myservice.default.svc.cluster.local: No answer*** Can't find myservice.svc.cluster.local: No answer*** Can't find myservice.cluster.local: No answer

解决方法：创建相关 service，将 SVC 的 name 写入 K8S 集群的 coreDNS 服务器中，于是

coreDNS 就能对 POD 的 initC 容器执行过程中的域名解析了。

kubectl apply -f myservice.yaml

网络异常，图片无法展示

NAME READY STATUS RESTARTS AGE
myapp-pod 0/1 Init:1/2 0 27mmyapp-pod 0/1 PodInitializing 0 28mmyapp-pod 1/1 Running 0 28m

网络异常，图片无法展示

问题 7：探测存活 pod 状态为 CrashLoopBackOff？

原因分析：镜像问题，导致容器重启失败。

解决方法：更换镜像即可。

网络异常，图片无法展示

问题 8：POD 创建失败？

readiness-httpget-pod 0/1 Pending 0 0sreadiness-httpget-pod 0/1 Pending 0 0sreadiness-httpget-pod 0/1 ContainerCreating 0 0sreadiness-httpget-pod 0/1 Error 0 2sreadiness-httpget-pod 0/1 Error 1 3sreadiness-httpget-pod 0/1 CrashLoopBackOff 1 4sreadiness-httpget-pod 0/1 Error 2 15sreadiness-httpget-pod 0/1 CrashLoopBackOff 2 26sreadiness-httpget-pod 0/1 Error 3 37sreadiness-httpget-pod 0/1 CrashLoopBackOff 3 52sreadiness-httpget-pod 0/1 Error 4 82s

原因分析：镜像问题导致容器无法启动。

解决方法：更换镜像。

问题 9：POD 的 ready 状态未进入？

readiness-httpget-pod   0/1     Running   0          116s

原因分析：POD 的执行命令失败，无法获取资源。

网络异常，图片无法展示

解决方法：进入容器内部，创建 yaml 定义的资源

网络异常，图片无法展示

问题 10：pod 创建失败？

网络异常，图片无法展示

原因分析：yml 文件内容出错—-使用中文字符；

解决方法：修改 myregistrykey 内容即可。

网络异常，图片无法展示

11、kube-flannel-ds-amd64-ndsf7 插件 pod 的 status 为 Init:0/1？

网络异常，图片无法展示

排查思路：kubectl -n kube-system describe pod kube-flannel-ds-amd64-ndsf7 #查询 pod 描述信息；

原因分析：k8s-slave1 节点拉取镜像失败。

解决方法：登录 k8s-slave1，重启 docker 服务，手动拉取镜像。

网络异常，图片无法展示

k8s-master 节点，重新安装插件即可。

kubectl create -f kube-flannel.yml;kubectl get nodes

网络异常，图片无法展示

12、K8S 创建服务 status 为 ErrImagePull？

网络异常，图片无法展示

排查思路：

kubectl describe pod test-nginx

网络异常，图片无法展示

原因分析：拉取镜像名称问题。

解决方法：删除错误 pod；重新拉取镜像；

kubectl delete pod test-nginx;kubectl run test-nginx --image=10.0.0.81:5000/nginx:alpine

13、不能进入指定容器内部？

网络异常，图片无法展示

原因分析：yml 文件 comtainers 字段重复，导致该 pod 没有该容器。

解决方法：去掉 yml 文件中多余的 containers 字段，重新生成 pod。

14、创建 PV 失败？

网络异常，图片无法展示

原因分析：pv 的 name 字段重复。

解决方法：修改 pv 的 name 字段即可。

网络异常，图片无法展示

15、pod 无法挂载 PVC？

网络异常，图片无法展示

原因分析：pod 无法挂载 PVC。

网络异常，图片无法展示

accessModes 与可使用的 PV 不一致，导致无法挂载 PVC，由于只能挂载大于 1G 且 accessModes 为 RWO 的 PV，故只能成功创建 1 个 pod，第 2 个 pod 一致 pending，按序创建时则第 3 个 pod 一直未被创建；

解决方法：修改 yml 文件中 accessModes 或 PV 的 accessModes 即可。

网络异常，图片无法展示

16、问题：pod 使用 PV 后，无法访问其内容？

网络异常，图片无法展示

原因分析：nfs 卷中没有文件或权限不对。

网络异常，图片无法展示

解决方法：在 nfs 卷中创建文件并授予权限。

网络异常，图片无法展示

17、查看节点状态失败？

Error from server (NotFound): the server could not find the requested resource (get services http:heapster:)

原因分析：没有 heapster 服务。

解决方法：安装 promethus 监控组件即可。

网络异常，图片无法展示

18、pod 一直处于 pending’状态？

网络异常，图片无法展示

原因分析：由于已使用同样镜像发布了 pod，导致无节点可调度。

网络异常，图片无法展示

解决方法：删除所有 pod 后部署 pod 即可。

网络异常，图片无法展示

19、helm 安装组件失败？

[root@k8s-master01 hello-world]# helm install
Error: This command needs 1 argument: chart nam
[root@k8s-master01 hello-world]# helm install ./Error: no Chart.yaml exists in directory "/root/hello-world"

原因分析：文件名格式不对。

解决方法：mv chart.yaml Chart.yaml

网络异常，图片无法展示

Kubernetes 日常故障解决

Kubernetes 日常故障解决

问题 1：K8S 集群服务访问失败？

问题 2：K8S 集群服务访问失败？

问题 3：K8S 集群服务暴露失败？

问题 4：外网无法访问 K8S 集群提供的服务？

问题 5：pod 状态为 ErrImagePull？

问题 6：创建 init C 容器后，其状态不正常？

问题 7：探测存活 pod 状态为 CrashLoopBackOff？

问题 8：POD 创建失败？

问题 9：POD 的 ready 状态未进入？

问题 10：pod 创建失败？

11、kube-flannel-ds-amd64-ndsf7 插件 pod 的 status 为 Init:0/1？

12、K8S 创建服务 status 为 ErrImagePull？

13、不能进入指定容器内部？

14、创建 PV 失败？

15、pod 无法挂载 PVC？

16、问题：pod 使用 PV 后，无法访问其内容？

17、查看节点状态失败？

18、pod 一直处于 pending’状态？

19、helm 安装组件失败？

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Kubernetes 日常故障解决

Kubernetes 日常故障解决

问题 1：K8S 集群服务访问失败？

问题 2：K8S 集群服务访问失败？

问题 3：K8S 集群服务暴露失败？

问题 4：外网无法访问 K8S 集群提供的服务？

问题 5：pod 状态为 ErrImagePull？

问题 6：创建 init C 容器后，其状态不正常？

问题 7：探测存活 pod 状态为 CrashLoopBackOff？

问题 8：POD 创建失败？

问题 9：POD 的 ready 状态未进入？

问题 10：pod 创建失败？

11、kube-flannel-ds-amd64-ndsf7 插件 pod 的 status 为 Init:0/1？

12、K8S 创建服务 status 为 ErrImagePull？

13、不能进入指定容器内部？

14、创建 PV 失败？

15、pod 无法挂载 PVC？

16、问题：pod 使用 PV 后，无法访问其内容？

17、查看节点状态失败？

18、pod 一直处于 pending’状态？

19、helm 安装组件失败？

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像