单master集群架构图:
目前Kubernetes最新版本是v1.24,但大部分公司一般不会使用最新版本。
目前公司使用比较多的:老版本是v1.15,因为v1.16改变了很多API接口版本,新版本使用比较多的是v1.18、v1.20。
一、实验环境
注意:生产环境中,etcd集群和master、node节点都应该部署在不同的机器上,此处为了实验方便,将三台etcd节点分别部署在了master和node节点上了。
k8s集群master01:192.168.41.10,kube-apiserver、kube-controller-manager、kube-scheduler、etcd k8s集群master02:192.168.41.20 k8s集群node01:192.168.41.42 kubelet、kube-proxy、docker k8s集群node02:192.168.41.43 etcd集群节点1:192.168.41.10 etcd etcd集群节点2:192.168.41.42 etcd集群节点3:192.168.41.43 负载均衡nginx+keepalive01(master):192.168.41.44 负载均衡nginx+keepalive02(backup):192.168.41.45 复制代码
二、部署etcd集群
2.1 操作系统初始化配置
所有节点进行操作。
#关闭防火墙,清除防火墙规则 systemctl stop firewalld systemctl disable firewalld iptables -F && iptables -t nat -F && iptables -t mangle -F && iptables -X #-X可以清除一些自定义的链表规则 #关闭selinux setenforce 0 sed -i 's/enforcing/disabled/' /etc/selinux/config #--------关闭swap------------- swapoff -a #临时关闭交换分区 sed -ri 's/.*swap.*/#&/' /etc/fstab #永久关闭交换分区 #------根据规划设置主机名------ hostnamectl set-hostname master01 && su hostnamectl set-hostname master02 && su hostnamectl set-hostname node01 && su hostnamectl set-hostname node02 && su #--------修改/etc/hosts文件------ #添加主机名和IP的映射关系 vim /etc/hosts 192.168.41.10 master01 192.168.41.20 master02 192.168.41.42 node01 192.168.41.43 node02 #-----------调整内核参数-------------- vim /etc/sysctl.d/k8s.conf #开启网桥模式,可将网桥的流量传递给iptables链 net.bridge.bridge-nf-call-ip6tables = 1 net.bridge.bridge-nf-call-iptables = 1 #关闭ipv6协议 net.ipv6.conf.all.disable_ipv6=1 #开启路由转发功能 sysctl --system #加载系统的内核参数 #-----------时间同步------------------- yum install ntpdate -y ntpdate time.windows.com #将时间同步加入计划性任务,每30分钟执行一次 crontab -e */30 * * * * /usr/sbin/ntpdate time.windows.com 复制代码
2.2 部署 etcd 集群(分布式键值对数据库)
etcd是Coreos团队于2013年6月发起的开源项目,它的目标是构建一个 高可用的分布式键值(key-value) 数据库。etcd内 部采用raft协议作为一致性算法,etcd是go语言编写的。
etcd作为服务发现系统,有以下的特点:
- 简单:安装配置简单,而且提供了HTTP API进行交互,使用也很简单。
- 安全:支持SSL证书验证。
- 快速:单实例支持每秒2k+读操作。
- 可靠:采用raft算法,实现分布式系统数据的可用性和一致性。
etcd目前默认使用2379端口提供HTTP API服务,2380端口和peer通信(这两个端口已经被IANA(互联网数字分配机构)官方预留给etcd)。
即etcd默认使用2379端口对外为客户端提供通讯,使用端口2380来进行服务器间内部通讯。 (etcd和api-server通信使用2379端口,etcd之间使用2380通信)
etcd在生产环境中一般推荐集群方式部署。由于etcd的leader选举机制,要求至少为3台或以上的奇数台。
准备签发证书环境:
CFSSL是CloudFlare公司开源的一款PKI/TLS 工具。CFSSL包含一个命令行工具和一个用于签名、验证和捆绑TLS证书的HTTP API服务。使用Go语言编写。
CFSSL使用配置文件生成证书,因此自签之前,需要生成它识别的json 格式的配置文件,CFSSL 提供了方便的命令行生成配置文件。
CFSSL用来为etcd提供TLS证书,它支持签三种类型的证书:
- client证书,服务端连接客户端时携带的证书,用于客户端验证服务端身份,如kubeapiserver 访问etcd;
- server证书,客户端连接服务端时携带的证书,用于服务端验证客户端身份,如etcd对外提供服务;
- peer证书,相互之间连接时使用的证书,如etcd节点之间进行验证和通信。
这里全部都使用同一套证书认证。
1)在 etcd01 节点上操作
#-----------------------准备cfssl证书生成工具---------- wget https://pkg.cfssl.org/R1.2/cfssl_linux-amd64 -O /usr/local/bin/cfssl wget https://pkg.cfssl.org/R1.2/cfssljson_linux-amd64 -O /usr/local/bin/cfssljson wget https://pkg.cfssl.org/R1.2/cfssl-certinfo_linux-amd64 -O /usr/local/bin/cfssl-certinfo #-O:指定下载目录 #Linux命令行两种下载方式: #wget 源URL地址 [-O 下载到指定路径] #curl 源URL地址 [-o 下载到指定路径] chmod +x /usr/local/bin/cfssl* --------------------- 虚线内注释 ------------------------------------------------ cfssl:证书签发的工具命令。 cfssljson:将cfssl生成的证书(json格式)变为文件承载式证书。 cfssl-certinfo:验证证书的信息。 cfssl-certinfo -cert <证书名称> #查看证书的信息 ------------------------------------------------------------------------------- #------------------------生成Etcd证书----------------------- #k8s目录用于存放生成证书的脚本文件 mkdir /opt/k8s/ cd /opt/k8s/ #上传 etcd-cert.sh 和 etcd.sh 到 /opt/k8s/ 目录中,为两个文件增加执行权限 chmod +x etcd-cert.sh etcd.sh #创建用于生成CA证书、etcd 服务器证书以及私钥的目录 mkdir /opt/k8s/etcd-cert/ mv etcd-cert.sh etcd-cert/ #将etcd-cert.sh移动到该目录 cd /opt/k8s/etcd-cert/ #切换到该目录 ./etcd-cert.sh #运行脚本生成CA证书、etcd 服务器证书以及私钥 #查看etcd-cert目录,以.json和.csr结尾的文件都是请求生成证书的文件,以pem结尾的文件都是最终生成的证书文件。 ls ca-config.json ca-csr.json ca.pem server.csr server-key.pem ca.csr ca-key.pem etcd-cert.sh server-csr.json server.pem #上传 etcd-v3.4.9-linux-amd64.tar.gz 到 /opt/k8s/ 目录中,启动etcd服务 #下载地址https://github.com/etcd-io/etcd/releases/download/v3.4.9/etcd-v3.4.9-1inux-amd64.tar.gz cd /opt/k8s/ tar zxvf etcd-v3.4.9-linux-amd64.tar.gz #查看安装包解压后的目录,该目录包含了etcd的启动文件etcd和etcd的管理文件etcdctl cd /opt/k8s/etcd-v3.4.9-linux-amd64/ ls -------------------------------------------------------------------------------- etcd:就是etcd服务的启动命令,后面可跟各种启动参数 etcdctl:主要为etcd服务提供了命令行操作 -------------------------------------------------------------------------------- #创建/opt/etcd目录,并创建三个子目录cfg、bin、ssl。cfg用于存放配置文件,bin用于存放执行文件,ssl用于存放证书文件 mkdir -p /opt/etcd/{cfg,bin,ssl} #将etcd和etcdctl两个文件移动到/opt/etcd/bin目录 mv etcd etcdctl /opt/etcd/bin/ #将证书文件复制到etcd01节点的/opt/etcd/ssl/目录 cp /opt/k8s/etcd-cert/*.pem /opt/etcd/ssl/ cd /opt/k8s/ #运行脚本,会卡在前台 ./etcd.sh etcd01 192.168.41.10 etcd02=https://192.168.41.42:2380,etcd03=https://192.168.41.43:2380 #另开一台终端,查看进程信息 ps -ef | grep etcd #将etcd目录中的所有文件发送给etcd02和etcd03节点 scp -r /opt/etcd/ root@192.168.41.42:/opt/ scp -r /opt/etcd/ root@192.168.41.43:/opt/ #传输etcd的系统服务管理文件 scp /usr/lib/systemd/system/etcd.service root@192.168.41.42:/usr/lib/systemd/system/ scp /usr/lib/systemd/system/etcd.service root@192.168.41.43:/usr/lib/systemd/system/ 复制代码
2)在 etcd02 和 etcd03 节点上操作
#-------------1、在 etcd02 节点上操作(42主机)------------------ vim /opt/etcd/cfg/etcd #[Member] ETCD_NAME="etcd02" #修改 ETCD_DATA_DIR="/var/lib/etcd/default.etcd" ETCD_LISTEN_PEER_URLS="https://192.168.41.42:2380" #修改 ETCD_LISTEN_CLIENT_URLS="https://192.168.41.42:2379" #修改 #[Clustering] ETCD_INITIAL_ADVERTISE_PEER_URLS="https://192.168.41.42:2380" #修改 ETCD_ADVERTISE_CLIENT_URLS="https://192.168.41.42:2379" #修改 ETCD_INITIAL_CLUSTER="etcd01=https://192.168.41.10:2380,etcd02=https://192.168.41.42:2380,etcd03=https://192.168.41.43:2380" ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster" ETCD_INITIAL_CLUSTER_STATE="new" systemctl start etcd systemctl enable etcd systemctl status etcd #-----------2、在 etcd03 节点上操作(43主机)----------------------- vim /opt/etcd/cfg/etcd #[Member] ETCD_NAME="etcd03" #修改 ETCD_DATA_DIR="/var/lib/etcd/default.etcd" ETCD_LISTEN_PEER_URLS="https://192.168.41.43:2380" #修改 ETCD_LISTEN_CLIENT_URLS="https://192.168.41.43:2379" #修改 #[Clustering] ETCD_INITIAL_ADVERTISE_PEER_URLS="https://192.168.41.43:2380" #修改 ETCD_ADVERTISE_CLIENT_URLS="https://192.168.41.43:2379" #修改 ETCD_INITIAL_CLUSTER="etcd01=https://192.168.41.10:2380,etcd02=https://192.168.41.42:2380,etcd03=https://192.168.41.43:2380" ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster" ETCD_INITIAL_CLUSTER_STATE="new" systemctl start etcd systemctl enable etcd systemctl status etcd #-------------3、检查etcd群集状态------------------------------- #三个etcd节点都可用查看 #切换到/opt/etcd/ssl目录,证书可使用相对路径。如果不在该目录下,证书要使用绝对路径。 #查看etcd集群每个节点的健康状态,true表示健康 ETCDCTL_API=3 /opt/etcd/bin/etcdctl --cacert=/opt/etcd/ssl/ca.pem --cert=/opt/etcd/ssl/server.pem --key=/opt/etcd/ssl/server-key.pem --endpoints="https://192.168.41.10:2379,https://192.168.41.42:2379,https://192.168.41.43:2379" endpoint health --write-out=table #查看etcd集群成员列表 ETCDCTL_API=3 /opt/etcd/bin/etcdctl --cacert=/opt/etcd/ssl/ca.pem --cert=/opt/etcd/ssl/server.pem --key=/opt/etcd/ssl/server-key.pem --endpoints="https://192.168.41.10:2379,https://192.168.41.42:2379,https://192.168.41.43:2379" --write-out=table member list #查看etcd集群中哪个节点是leader,true表示leader ETCDCTL_API=3 /opt/etcd/bin/etcdctl --cacert=/opt/etcd/ssl/ca.pem --cert=/opt/etcd/ssl/server.pem --key=/opt/etcd/ssl/server-key.pem --endpoints="https://192.168.41.10:2379,https://192.168.41.42:2379,https://192.168.41.43:2379" endpoint status --write-out=table #------------------注释--------------------------------------- --cert-file:识别HTTPS端使用SSL证书文件 --key-file:使用此SSL密钥文件标识HTTPS客户端 --ca-file:使用此CA证书验证启用https的服务器的证书 --endpoints:集群中以逗号分隔的机器地址列表 cluster-health:检查etcd集群的运行状况 #------------------------------------------------------------- #因为是通过客户端的方式进行访问,所以用2379端口,检查每个节点的状态 复制代码
在 etcd02 节点上操作(42主机):
在 etcd03 节点上操作(43主机):
检查etcd群集状态:
附录1:etcd-cert.sh
#!/bin/bash #配置证书生成策略,让 CA 软件知道颁发有什么功能的证书,生成用来签发其他组件证书的根证书 cat > ca-config.json <<EOF { "signing": { "default": { "expiry": "87600h" }, "profiles": { "www": { "expiry": "87600h", "usages": [ "signing", "key encipherment", "server auth", "client auth" ] } } } } EOF #ca-config.json:可以定义多个 profiles,分别指定不同的过期时间、使用场景等 参数; #后续在签名证书时会使用某个 profile;此实例只有一个 www 模板。 #expiry:指定了证书的有效期,87600h 为10年,如果用默认值一年的话,证书到期 后集群会立即宕掉 #signing:表示该证书可用于签名其它证书;生成的 ca.pem 证书中 CA=TRUE; #key encipherment:表示使用非对称密钥加密,如 RSA 加密; #key encipherment:表示使用非对称密钥加密,如 RSA 加密; #server auth:表示client可以用该 CA 对 server 提供的证书进行验证; #client auth:表示server可以用该 CA 对 client 提供的证书进行验证; #注意标点符号,最后一个字段一般是没有逗号的。 #----------------------- #生成CA证书和私钥(根证书和私钥) #特别说明: cfssl和openssl有一些区别,openssl需要先生成私钥,然后用私钥生>成请求文件,最后生成签名的证书和私钥等,但是cfssl可以直接得到请求文件。 cat > ca-csr.json <<EOF { "CN": "etcd", "key": { "algo": "rsa", "size": 2048 }, "names": [ { "C": "CN", "L": "Beijing", "ST": "Beijing" } ] } EOF #CN:Common Name,浏览器使用该字段验证网站或机构是否合法,一般写的是域名 #key:指定了加密算法,一般使用rsa(size:2048) #C:Country,国家 #ST:State,州,省 #L:Locality,地区,城市 #O: Organization Name,组织名称,公司名称 #OU: Organization Unit Name,组织单位名称,公司部门 cfssl gencert -initca ca-csr.json | cfssljson -bare ca #生成的文件: #ca-key.pem:根证书私钥 #ca.pem:根证书 #ca.csr:根证书签发请求文件 #cfssl gencert -initca <CSRJSON>:使用 CSRJSON 文件生成生成新的证书和私钥>。如果不添加管道符号,会直接把所有证书内容输出到屏幕。 #注意:CSRJSON 文件用的是相对路径,所以 cfssl 的时候需要 csr 文件的路径下>执行,也可以指定为绝对路径。 #cfssljson 将 cfssl 生成的证书(json格式)变为文件承载式证书,-bare 用于命名生成的证书文件。 #----------------------- #生成 etcd 服务器证书和私钥 cat > server-csr.json <<EOF { "CN": "etcd", "hosts": [ "192.168.41.10", "192.168.41.42", "192.168.41.43" ], "key": { "algo": "rsa", "size": 2048 }, "names": [ { "C": "CN", "L": "BeiJing", "ST": "BeiJing" } ] } EOF #hosts:将所有 etcd 集群节点添加到 host 列表,需要指定所有 etcd 集群的节点ip 或主机名不能使用网段,新增 etcd 服务器需要重新签发证书。 cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=www server-csr.json | cfssljson -bare server #生成的文件: #server.csr:服务器的证书请求文件 #server-key.pem:服务器的私钥 #server.pem:服务器的数字签名证书 #-config:引用证书生成策略文件 ca-config.json #-profile:指定证书生成策略文件中的的使用场景,比如 ca-config.json 中的 www 复制代码
附录2:etcd.sh
#!/bin/bash #example: ./etcd.sh etcd01 192.168.41.10 etcd02=https://192.168.41.42:2380,etcd03=https://192.168.41.43:2380 #创建etcd配置文件/opt/etcd/cfg/etcd ETCD_NAME=$1 ETCD_IP=$2 ETCD_CLUSTER=$3 WORK_DIR=/opt/etcd cat > $WORK_DIR/cfg/etcd <<EOF #[Member] ETCD_NAME="${ETCD_NAME}" ETCD_DATA_DIR="/var/lib/etcd/default.etcd" ETCD_LISTEN_PEER_URLS="https://${ETCD_IP}:2380" ETCD_LISTEN_CLIENT_URLS="https://${ETCD_IP}:2379" #[Clustering] ETCD_INITIAL_ADVERTISE_PEER_URLS="https://${ETCD_IP}:2380" ETCD_ADVERTISE_CLIENT_URLS="https://${ETCD_IP}:2379" ETCD_INITIAL_CLUSTER="etcd01=https://${ETCD_IP}:2380,${ETCD_CLUSTER}" ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster" ETCD_INITIAL_CLUSTER_STATE="new" EOF #Member:成员配置 #ETCD_NAME:节点名称,集群中唯一。成员名字,集群中必须具备唯一性,如etcd01 #ETCD_DATA_DIR:数据目录。指定节点的数据存储目录,这些数据包括节点ID,集群ID,集群初始化配置,Snapshot文件,若未指定-wal-dir,还会存储WAL文件;如果不指定会用缺省目录 #ETCD_LISTEN_PEER_URLS:集群通信监听地址。用于监听其他member发送信息的地址。ip为全0代表监听本机所有>接口 #ETCD_LISTEN_CLIENT_URLS:客户端访问监听地址。用于监听etcd客户发送信息的地址。ip为全0代表监听本机所>有接口 #Clustering:集群配置 #ETCD_INITIAL_ADVERTISE_PEER_URLS:集群通告地址。其他member使用,其他member通过该地址与本member交互>信息。一定要保证从其他member能可访问该地址。静态配置方式下,该参数的value一定要同时在--initial-cluster参数中存在 #ETCD_ADVERTISE_CLIENT_URLS:客户端通告地址。etcd客户端使用,客户端通过该地址与本member交互信息。一>定要保证从客户侧能可访问该地址 #ETCD_INITIAL_CLUSTER:集群节点地址。本member使用。描述集群中所有节点的信息,本member根据此信息去联>系其他member #ETCD_INITIAL_CLUSTER_TOKEN:集群Token。用于区分不同集群。本地如有多个集群要设为不同 #ETCD_INITIAL_CLUSTER_STATE:加入集群的当前状态,new是新集群,existing表示加入已有集群。 #创建etcd.service服务管理文件 cat > /usr/lib/systemd/system/etcd.service <<EOF [Unit] Description=Etcd Server After=network.target After=network-online.target Wants=network-online.target [Service] Type=notify EnvironmentFile=${WORK_DIR}/cfg/etcd ExecStart=${WORK_DIR}/bin/etcd \ --cert-file=${WORK_DIR}/ssl/server.pem \ --key-file=${WORK_DIR}/ssl/server-key.pem \ --trusted-ca-file=${WORK_DIR}/ssl/ca.pem \ --peer-cert-file=${WORK_DIR}/ssl/server.pem \ --peer-key-file=${WORK_DIR}/ssl/server-key.pem \ --peer-trusted-ca-file=${WORK_DIR}/ssl/ca.pem \ --logger=zap \ --enable-v2 Restart=on-failure LimitNOFILE=65536 [Install] WantedBy=multi-user.target EOF #--enable-v2:开启 etcd v2 API 接口。当前 flannel 版本不支持 etcd v3 通信 #--logger=zap:使用 zap 日志框架。zap.Logger 是go语言中相对日志库中性能最高的 #--peer开头的配置项用于指定集群内部TLS相关证书(peer 证书),这里全部都使用同一套证书认证 #不带--peer开头的的参数是指定 etcd 服务器TLS相关证书(server 证书),这里全部都使用同一套证书认证 systemctl daemon-reload systemctl enable etcd systemctl restart etcd 复制代码