一 概述
在容器 & 服务:Docker 应用的 Jenkins 构建 (二)中,我们了解了在jenkins中,使用compose等工具构建发布的方法。在这里,已经初步有了一点集群的影子(备份,监控及切换),但毕竟还不是多节点同时对外提供服务,例如zuul、nginx等负载对外提供负载均衡(网关)服务,来支持后面的多应用实例共同对外提供服务。本章将会对这点进行探索。
二 kubernetes基础
2.1 推测
在正式开始之前,我们先自己“遐想”一下,在传统基于物理机/虚机的开发模式中,我们通过每台机器部署一个应用实例的方式做多极部署,然后根据负载均衡方式的选择,可能有以下两种:
1)使用nginx做负载均衡,把前端流量分发给后端应用实例;
2)或者是服务端负载均衡方式下,在应用启动时,会把自己注册到zookeeper或zuul(eureka)、gateway等服务中心,再对外暴露网关地址。
如此简单类比的话,如果我们使用的是方式2),那么就是启动多个容器,每个容器看做是一台部署了应用的虚机。当然,这只是一个非常初级的推测。
2.2 遗留问题与k8s
回顾上一篇的一个遗留问题:Docker的Containers列表中,有几个/k8s_开头的,其中/k8s_dockerdemoapplication1_dockerxxxx的这个我们已经定位病处理,但还有几个java-demo的作为遗留,下面就来尝试处理一下,顺便对k8s也有一个初步了解。
上一篇已经说过,这几个并非通过compose启动,所以docker stack services 并没有查到。那么可能就是k8s的deployment,所以通过kubectl查看deployments:
bogon xxx$ kubectl get deployments NAME READY UP-TO-DATE AVAILABLE AGE java-demo 3/3 3 3 165d kubernetes-bootcamp 0/1 1 0 69s
果然,第一个就是。然后再使用delete删除,就可以了:
bogon xxx$ kubectl delete deployment java-demo deployment.extensions "java-demo" deleted
再次查看Containers列表,确认成功:
接下来我们会来介绍k8s,然后通过它来构建和管理应用集群。
2.3 K8s部署
2.3.1 基础知识
根据Kubernetes文档描述:
一旦运行了 Kubernetes 集群,就可以在其上部署容器化应用程序。 为此,您需要创建 Kubernetes Deployment 配置。Deployment 指挥 Kubernetes 如何创建和更新应用程序的实例。创建 Deployment 后,Kubernetes master 将应用程序实例调度到集群中的各个节点上。
创建应用程序实例后,Kubernetes Deployment 控制器会持续监视这些实例。 如果托管实例的节点关闭或被删除,则 Deployment 控制器会将该实例替换为群集中另一个节点上的实例。 这提供了一种自我修复机制来解决机器故障维护问题。
在没有 Kubernetes 这种编排系统之前,安装脚本通常用于启动应用程序,但它们不允许从机器故障中恢复。通过创建应用程序实例并使它们在节点之间运行, Kubernetes Deployments 提供了一种与众不同的应用程序管理方法。
下图描述了一个node应用在Kubernetes部署后的Kubernetes集群形态:
2.3.2 demo
通过官方demo,我们先尝试一下k8s部署和暴露应用过程。kubernetes-bootcamp是google-samples镜像下的一个demo应用,我们直接创建deployment:
1、部署
bogon xxx$ kubectl create deployment kubernetes-bootcamp --image=gcr.io/google-samples/kubernetes-bootcamp:v1 deployment.apps/kubernetes-bootcamp created
2、查看deployments
bogon xxx$ kubectl get deployments NAME READY UP-TO-DATE AVAILABLE AGE kubernetes-bootcamp 0/1 1 0 47m
3、暴露服务,指定端口为8080
bogon xxx$ kubectl expose deployment/kubernetes-bootcamp --type="NodePort" --port 8080 service/kubernetes-bootcamp exposed
4、再查询一下服务列表
bogon xxx$ kubectl get services NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE java-demo ClusterIP 10.96.163.159 <none> 80/TCP 165d kubernetes ClusterIP 10.96.0.1 <none> 443/TCP 260d kubernetes-bootcamp NodePort 10.102.30.145 <none> 8080:32710/TCP 10s
其中,kubernetes-bootcamp就是我们刚刚暴露的服务,端口为8080。
5、查看服务详情
kubectl describe services/kubernetes-bootcamp
本地的查询结果:
6、创建环境变量
创建一个明伟NODE_PORT的环境变量,值是我们刚才暴露的服务,分配给节点的端口(NodePort):
bogon xxx$ export NODE_PORT=$(kubectl get services/kubernetes-bootcamp -o go-template='{{(index .spec.ports 0).nodePort}}') bogon xxx$ echo NODE_PORT=$NODE_PORT NODE_PORT=32710
7、查看deployment详情
kubectl describe deployment
输出内容:
bogon xxx$ kubectl describe deployment Name: kubernetes-bootcamp Namespace: default CreationTimestamp: Wed, 03 Mar 2021 11:40:25 +0800 Labels: app=kubernetes-bootcamp Annotations: deployment.kubernetes.io/revision: 1 Selector: app=kubernetes-bootcamp Replicas: 1 desired | 1 updated | 1 total | 0 available | 1 unavailable StrategyType: RollingUpdate MinReadySeconds: 0 RollingUpdateStrategy: 25% max unavailable, 25% max surge Pod Template: Labels: app=kubernetes-bootcamp Containers: kubernetes-bootcamp: Image: gcr.io/google-samples/kubernetes-bootcamp:v1 Port: <none> Host Port: <none> Environment: <none> Mounts: <none> Volumes: <none> Conditions: Type Status Reason ---- ------ ------ Available False MinimumReplicasUnavailable Progressing False ProgressDeadlineExceeded OldReplicaSets: <none> NewReplicaSet: kubernetes-bootcamp-8dc4b977d (1/1 replicas created) Events: <none>
8、get pods -l参数
bogon xxx$ kubectl get pods -l run=kubernetes-bootcamp No resources found.
并没有查到,跟说好的不一样?
再看一下pods列表:
bogon xxx$ kubectl get pods NAME READY STATUS RESTARTS AGE kubernetes-bootcamp-8dc4b977d-n7xn7 0/1 ImagePullBackOff 0 3h30m
嗯。。不是ready状态,状态为ImagePullBackOff,也就是镜像缺失/失效,所以没有运行。目测又是网络/墙的坑。
9、使用describe命令查看失败明细
bogon xxx$ kubectl describe pod kubernetes-bootcamp-8dc4b977d-n7xn7 Name: kubernetes-bootcamp-8dc4b977d-n7xn7 Namespace: default Priority: 0 PriorityClassName: <none> Node: docker-desktop/192.168.65.3 Start Time: Wed, 03 Mar 2021 11:40:26 +0800 Labels: app=kubernetes-bootcamp pod-template-hash=8dc4b977d Annotations: <none> Status: Pending IP: 10.1.0.162 Controlled By: ReplicaSet/kubernetes-bootcamp-8dc4b977d Containers: kubernetes-bootcamp: Container ID: Image: gcr.io/google-samples/kubernetes-bootcamp:v1 Image ID: Port: <none> Host Port: <none> State: Waiting Reason: ImagePullBackOff Ready: False Restart Count: 0 Environment: <none> Mounts: /var/run/secrets/kubernetes.io/serviceaccount from default-token-62ccr (ro) Conditions: Type Status Initialized True Ready False ContainersReady False PodScheduled True Volumes: default-token-62ccr: Type: Secret (a volume populated by a Secret) SecretName: default-token-62ccr Optional: false QoS Class: BestEffort Node-Selectors: <none> Tolerations: node.kubernetes.io/not-ready:NoExecute for 300s node.kubernetes.io/unreachable:NoExecute for 300s Events: Type Reason Age From Message ---- ------ ---- ---- ------- Warning Failed 35m (x40 over 3h45m) kubelet, docker-desktop Error: ErrImagePull Normal BackOff 5m48s (x917 over 3h45m) kubelet, docker-desktop Back-off pulling image "gcr.io/google-samples/kubernetes-bootcamp:v1" Warning Failed 48s (x938 over 3h45m) kubelet, docker-desktop Error: ImagePullBackOff
10、寻找可用镜像执行
本地查找之前上传的镜像列表:
使用flamingskys/java-demo镜像重新执行上述过程即可。
2.3.3 kubecrl命令体系
根据kubernetes中文文档,目前支持的命令列表中共有40+命令,其中的常用命令,按照职能简单分类如下: