Kubernetes(K8s) 安装(使用kubeadm安装Kubernetes集群)
概述:
这篇文章是为了介绍使用kubeadm安装Kubernetes集群(可以用于生产级别)。使用了Centos 7系统。
PS:
篇幅有点长,但是比较详细、比较全面
一、Centos7 配置说明
1.1 Firewalld(防火墙)
CentOS Linux 7 默认开起来防火墙服务(firewalld),而Kubernetes的Master与工作Node之间会有大量的网络通信,安全的做法是在防火墙上配置Kbernetes各组件(api-server、kubelet等等)需要相互通信的端口号。在安全的内部网络环境中可以关闭防火墙服务。
关闭防火墙的命令:
1 # firewall-cmd --state #查看防火墙状态
2 # systemctl stop firewalld.service #停止firewall
3 # systemctl disable firewalld.service #禁止firewall开机启动
1.2 SELinux
建议禁用SELinux,让容器可以读取主机文件系统
执行命令:
1 # getenforce #查看selinux状态
2 # setenforce 0 #临时关闭selinux
3 # sed -i 's/^ *SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config #永久关闭(需重启系统)
4 # shutdown -r now #重启系统
二、安装准备工作
2.1 安装环境
软硬件
最低配置
推荐配置
CPU和内存
Master: 至少2 Core和4G内存
Node:至少4 Core和16G内存
Master:4 core和16G内存
Node:应根据需要运行的容器数量进行配置
Linux操作系统 基于x86_64架构的各种Linux发行版本,Kernel版本要求在3.10及以上
Red Hat Linux 7
CentOS 7
说明:
以上为建议配置,实际安装过程中,Master必须2 core 及以上(否则安装失败,切记),Node可以采用1 core。
2.2 部署环境说明
主机列表:
主机名
Centos版本
ip
docker version
flannel version
Keepalived version
主机配置
备注
master01
7.6.1810
192.168.0.6
18.09.9
v0.11.0
v1.3.5
2C1G
control plane
work01
7.6.1810
192.168.0.10
18.09.9
/
/
1C1G
worker nodes
work02
7.6.1810
192.168.0.12
18.09.9
/
/
1C1G
worker nodes
VIP
7.6.1810
192.168.0.130
18.09.9
v0.11.0
v1.3.5
4C4G
在control plane上浮动
client
7.6.1810
192.168.0.234
/
/
/
4C4G
client(可不需要)
共有7台服务器,3台control plane,3台work,1台client。
k8s 版本(可根据需要进行更改):
主机名
kubelet version
kubeadm version
kubectl version
备注
master01
v1.16.4
v1.16.4
v1.16.4
kubectl选装
work01
v1.16.4
v1.16.4
v1.16.4
kubectl选装
work02
v1.16.4
v1.16.4
v1.16.4
kubectl选装
client
/
/
v1.16.4
client
2.3. 配置主机名(master和node节点都执行)
2.3.1 修改主机名
Master主机改为master01,执行以下命令:
1 # hostnamectl set-hostname master01 #修改主机名称为master01
2 # more /etc/hostname #查看修改结果
同样的修改node01和node02(注意主机名为node01和node02)
说明:
退出重新登陆即可显示新设置的主机名master01,重新登录之后
2.3.2 修改hosts文件
执行以下命令:
cat >> /etc/hosts << EOF
192.168.0.6 master01
192.168.0.10 node01
192.168.0.12 node02
EOF
2.3.3 禁用swap
Kubeadm建议关闭交换空间的使用,简单来说,执行swapoff -a命令,然后在/etc/fstab中删除对swap的加载,并重新启动服务器即可。
临时禁用,执行以下命令:
swapoff -a
永久禁用,需要在swapoff -a之后,执行以下命令:
sed -i.bak '/swap/s/^/#/' /etc/fstab
2.3.4 设置kubernetes源
2.3.4.1 新增kubernetes源
执行以下命令:
cat < /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF
2.3.4.2 更新缓存
yum clean all
yum -y makecache
三、Docker安装(master和node节点都执行)
注意:
安装docker之前,最好确认一下,kubernetes支持哪些版本的docker(kubernetes和docker的版本要对应,否则可能会造成重新安装)。
3.1 卸载/更新已经安装的Docker
卸载docker
1. 列出安装过的包
yum list installed | grep docker
2. 根据安装过的包进行卸载
yum -y remove docker-ce-cli.x86_64
yum -y remove docker-ce.x86_64
yum -y remove containerd.io
更新docker
yum -y update docker
3.2 安装Docker环境
3.2.1 配置docker源
如已安装过docker,则不需要进行此步骤
wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo
3.2.2 安装依赖包
yum install -y yum-utils device-mapper-persistent-data lvm2
3.2.3 设置从stable仓库获取docker
yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo
3.2.4 安装Docker
yum install docker-ce-18.09.9 docker-ce-cli-18.09.9 containerd.io -y
说明:
执行以上命令之前,可以看看docker版本,执行以下命令查看
yum list docker-ce --showduplicates | sort -r
3.2.5 启动Docker(并设置为开机启动)
systemctl start docker && systemctl enable docker
3.2.6 命令补全
安装bash-completion
yum -y install bash-completion
加载bash-completion
source /etc/profile.d/bash_completion.sh
3.2.7 镜像加速(并修改Cgoup Driver)
mkdir -p /etc/docker
tee /etc/docker/daemon.json <<-'EOF'
{
"registry-mirrors": ["https://usydjf4t.mirror.aliyuncs.com",
"https://registry.docker-cn.com"]
, "exec-opts": ["native.cgroupdriver=systemd"]
}
EOF
systemctl daemon-reload
systemctl restart docker
说明:
修改cgroupdriver是为了消除告警:
四、Keepalived安装(master节点安装)
4.1 安装keepalived
yum -y install keepalived
4.2 keepalived配置
保留默认配置
mv /etc/keepalived/keepalived.conf /etc/keepalived/keepalived_default.conf
写入新的配置
cat < /etc/keepalived/keepalived.conf
! Configuration File for keepalived
global_defs {
router_id master01
}
vrrp_instance VI_1 {
state MASTER
interface enp0s3
virtual_router_id 50
priority 100
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.0.130
}
}
EOF
说明:
特别注意红色字体文本,master01是主机名称(如果有其他主机则使用对应的主机名称进行替换),enp0s3是网卡名称(每个linux系统可能不一致),192.168.0.130是虚拟IP
4.3 启动keepalived
service keepalived start && systemctl enable keepalived
4.4 VIP查看
在master机器上执行
ip a
可以看到VIP在master01(目前只有一台master,以后可能会有多个master)上
五、安装k8s(master和node节点都执行)
5.1 查看kubernetes版本
yum list kubelet --showduplicates | sort -r
说明:
本文安装的kubelet版本是1.16.4,该版本支持的docker版本为1.13.1, 17.03, 17.06, 17.09, 18.06, 18.09。
5.2 安装kubelet、kubeadm和kubectl(注意版本号,根据需要进行改变)
yum install -y kubelet-1.16.4 kubeadm-1.16.4 kubectl-1.16.4
说明:
kubelet 运行在集群所有节点上,用于启动Pod和容器等对象的工具
kubeadm 用于初始化集群,启动集群的命令工具
kubectl 用于和集群通信的命令行,通过kubectl可以部署和管理应用,查看各种资源,创建、删除和更新各种组件
5.3 启动kubelet(并设置为开机启动)
systemctl enable kubelet && systemctl start kubelet
5.4 命令补全
echo "source <(kubectl completion bash)" >> ~/.bash_profile
source .bash_profile
5.5 下载镜像
Kubernetes几乎所有的安装组件和Docker镜像都放在goolge自己的网站上,直接访问可能会有网络问题,这里的解决办法是从阿里云镜像仓库下载镜像,拉取到本地以后改回默认的镜像tag。本文通过运行image.sh脚本方式拉取镜像。
直接执行以下命令(灰色背景部分):
more image.sh #以下为image.sh文件的内容
!/bin/bash
url=registry.cn-hangzhou.aliyuncs.com/loong576 #阿里云镜像仓库地址,可以按需修改
version=v1.16.4 #安装的kubernetes的版本(可以按需修改)
images=(kubeadm config images list --kubernetes-version=$version|awk -F '/' '{print $2}'
)
for imagename in {images[@]} ; do docker pull url/imagename docker tag url/imagename k8s.gcr.io/imagename
docker rmi -f url/imagename
done
注意:
如果需要下载其他的kubernetes版本,需要修改对应的版本号(红色字体部分)
5.6 查看已经下载的镜像
docker images
六、网络插件(flannel)配置(Master执行)
本文的k8s网络使用flannel,该网络需要设置内核参数bridge-nf-call-iptables=1,修改这个参数需要系统有br_netfilter模块。
说明:
K8s网络插件有很多,使用网络插件之前,要进行判断是否和系统适配。
6.1 br_netfilter模块加载
查看br_netfilter模块:
lsmod |grep br_netfilter
如果系统没有br_netfilter模块则执行下面的新增命令,如有则忽略。
永久新增br_netfilter模块:
cat > /etc/rc.sysinit << EOF
!/bin/bash
for file in /etc/sysconfig/modules/*.modules ; do
[ -x file ] && file
done
EOF
cat > /etc/sysconfig/modules/br_netfilter.modules << EOF
modprobe br_netfilter
EOF
chmod 755 /etc/sysconfig/modules/br_netfilter.modules
6.2 内核参数永久修改
cat < /etc/sysctl.d/k8s.conf
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
EOF
sysctl -p /etc/sysctl.d/k8s.conf
说明:
如安装网络插件之后,长时间状态没有变更,则可以试试重启机器(或者是虚拟机,这里是指Centos 7系统)。
七、初始化Master(Master节点执行)
说明:
Master的kubernetes之前,须先确定要确定的网络插件(因为可能会影响到初始化的参数),不同的系统可能需要使用不同的网络插件(Centos 不支持 Calico)。
建议先阅读网络插件资料。(Kubernetes所有网络插件说明:这里)
7.1 创建初始化文件
7.1.1 获取默认的初始化参数文件
kubeadm config print init-defaults > init.default.yaml
7.1.2 查看init.default.yaml文件
cat init.default.yaml
7.1.3 配置初始化文件
创建kubeadm.conf.yaml文件,输入以下内容(灰色背景部分):
apiVersion: kubeadm.k8s.io/v1beta2
kind: ClusterConfiguration
kubernetesVersion: v1.16.4
apiServer:
certSANs: #填写所有kube-apiserver节点的hostname、IP、VIP
- master01
- node01
- node02
- 192.168.0.6
- 192.168.0.10
- 192.168.0.12
- 192.168.0.130
controlPlaneEndpoint: "192.168.0.130:6443"
networking:
podSubnet: "10.244.0.0/16" #这里需要根据具体的网络插件来配置(这里使用的flannel网络插件配置)
说明:
注意红色字体部分内容,需要根据init.default.yaml文件和自己的需要进行更改
7.2 初始化kubernetes
kubeadm init --config=kubeadm.conf.yaml
说明:
如果初始化失败,可执行kubeadm reset后重新初始化(执行以下两条命令)
kubeadm reset
rm -rf $HOME/.kube/config
初始化成功,如下图:
按照提示执行下面的命令,复制配置文件到普通用户的home目录下:
mkdir -p $HOME/.kube
cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
chown (id -u):(id -g) $HOME/.kube/config
在其他位置(或者主机),保存如下信息(其他node节点加入集群时使用):
You should now deploy a pod network to the cluster.
Run "kubectl apply -f [podnetwork].yaml" with one of the options listed at:
https://kubernetes.io/docs/concepts/cluster-administration/addons/
You can now join any number of control-plane nodes by copying certificate authorities
and service account keys on each node and then running the following as root:
kubeadm join 192.168.0.130:6443 --token afeqnz.vhp0e8rtrw6jz6v2 \
--discovery-token-ca-cert-hash sha256:d6a450aafb14e82efb69fbcb71e426bfed8e423d64b37bac85b3ff8ce7dc6562 \
--control-plane
Then you can join any number of worker nodes by running the following on each as root:
node加入集群时使用
kubeadm join 192.168.0.130:6443 --token afeqnz.vhp0e8rtrw6jz6v2 \
--discovery-token-ca-cert-hash sha256:d6a450aafb14e82efb69fbcb71e426bfed8e423d64b37bac85b3ff8ce7dc6562
7.3 加载环境变量
echo "export KUBECONFIG=/etc/kubernetes/admin.conf" >> ~/.bash_profile
source .bash_profile
八、node节点加入集群
8.1 开启Master节点防火墙端口
说明:
如果master节点的防火墙已经关闭,可以直接跳过此小节
如果node已经加入其它集群,需要退出集群,请执行在node上执行:
kubeadm reset
查看防火墙状态:
systemctl status firewalld 或者 firewall-cmd --state
开启6443端口
firewall-cmd --zone=public --add-port=6443/tcp --permanent
出现success表明添加成功
命令含义:
--zone #作用域
--add-port=80/tcp #添加端口,格式为:端口/通讯协议
--permanent #永久生效,没有此参数重启后失效
重启防火墙
systemctl restart firewalld.service
说明:
Kubernetes集群中的Service可使用的物理机端口号范围为30000~32767
一次全部公开所有可能使用的端口:
firewall-cmd --zone=public --add-port=30000-32767/tcp --permanent
systemctl restart firewalld.service
8.2 加入集群
Master节点在初始化完成之后,最后一行代码,如下:
kubeadm join 192.168.0.130:6443 --token afeqnz.vhp0e8rtrw6jz6v2 \
--discovery-token-ca-cert-hash sha256:d6a450aafb14e82efb69fbcb71e426bfed8e423d64b37bac85b3ff8ce7dc6562
把两行信息复制出来,在node节点执行,如下图:(join成功)
在master节点,执行以下命令查看已经加入的节点
kubectl get nodes
说明:
由于没有安装网络插件,这里STATUS为NotReady
九、安装网络插件(Master)
在master主机上执行以下命令:
kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/2140ac876ef134e0ed5af15c65e414cf26827915/Documentation/kube-flannel.yml
说明:
由于网络原因,可能会安装失败,可以在浏览器直接下载kube-flannel.yml文件(也可以在浏览器打开url地址,然后复制文件内容到文件),然后再执行apply
查看节点状态,执行以下命令:
kubectl get nodes
说明:
STATUS从NotReady变为Ready
十、Client配置(client端执行)
10.1 新增kubernetes源
cat < /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF
10.2 更新缓存
yum clean all && yum -y makecache
10.3 安装kubectl
yum install -y kubectl-1.16.4
10.4 命令补全
安装bash- completion
yum -y install bash-completion
加载bash-completion
source /etc/profile.d/bash_completion.sh
10.5 从Master节点拷贝admin.conf
mkdir -p /etc/kubernetes
scp 192.168.0.6:/etc/kubernetes/admin.conf /etc/kubernetes/
说明:
192.168.0.6 是master主机
echo "export KUBECONFIG=/etc/kubernetes/admin.conf" >> ~/.bash_profile
source .bash_profile
10.6 加载环境变量
echo "source <(kubectl completion bash)" >> ~/.bash_profile
source .bash_profile
10.7 Kubectl 测试
kubectl get nodes
kubectl get cs
kubectl get po -o wide -n kube-system
十一、Dashboard搭建(client端执行)
11.1 下载yaml
wget https://raw.githubusercontent.com/kubernetes/dashboard/v2.0.0-beta8/aio/deploy/recommended.yaml
说明:
如果连接超时,可以多试几次。也可以在这里下载
11.2 修改镜像地址
sed -i 's/kubernetesui/registry.cn-hangzhou.aliyuncs.com/loong576/g' recommended.yaml
说明:
也可以采用其他的一些镜像(切换镜像,需要更改recommended.yaml文件)
更改镜像操作:
如果需要更改镜像的版本号,需要在阿里云查询一下是否有镜像
下载镜像命令:(注意阿里云是没有带版本号的,需要自己录入版本号)
docker pull registry.cn-hangzhou.aliyuncs.com/kubernetesui/dashboard:v2.0.0-rc5
11.3 配置yaml
外网访问
sed -i '/targetPort: 8443/a nodePort: 30001n type: NodePort' recommended.yaml
说明:
配置NodePort,外部通过https://NodeIp:NodePort 访问Dashboard,此时端口为30001
11.4 新增管理员账号
创建超级管理员的账号用于登录Dashboard
cat >> recommended.yaml << EOF
------------------- dashboard-admin -------------------
apiVersion: v1
kind: ServiceAccount
metadata:
name: dashboard-admin
namespace: kubernetes-dashboard
apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRoleBinding
metadata:
name: dashboard-admin
subjects:
- kind: ServiceAccount
name: dashboard-admin
namespace: kubernetes-dashboard
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: cluster-admin
EOF
11.5 部署Dashboard
kubectl apply -f recommended.yaml
状态查看:
kubectl get all -n kubernetes-dashboard
令牌查看:
kubectl describe secrets -n kubernetes-dashboard dashboard-admin
令牌为(一定要注意可能存在换行的情况):
eyJhbGciOiJSUzI1NiIsImtpZCI6IllkWjQxWENEYnBXYV9rUlNqWTRldjVOYXV3M0tPTklYTVZTWUZWOXp0SHMifQ.eyJpc3MiOiJrdWJlcm5ldGVzL3NlcnZpY2VhY2NvdW50Iiwia3ViZXJuZXRlcy5pby9zZXJ2aWNlYWNjb3VudC9uYW1lc3BhY2UiOiJrdWJlcm5ldGVzLWRhc2hib2FyZCIsImt1YmVybmV0ZXMuaW8vc2VydmljZWFjY291bnQvc2VjcmV0Lm5hbWUiOiJkYXNoYm9hcmQtYWRtaW4tdG9rZW4tZzRwdzUiLCJrdWJlcm5ldGVzLmlvL3NlcnZpY2VhY2NvdW50L3NlcnZpY2UtYWNjb3VudC5uYW1lIjoiZGFzaGJvYXJkLWFkbWluIiwia3ViZXJuZXRlcy5pby9zZXJ2aWNlYWNjb3VudC9zZXJ2aWNlLWFjY291bnQudWlkIjoiNjNmNzllODUtNzMzMy00MDY1LTg1YTEtYzkxZTkzNjk3ZjA0Iiwic3ViIjoic3lzdGVtOnNlcnZpY2VhY2NvdW50Omt1YmVybmV0ZXMtZGFzaGJvYXJkOmRhc2hib2FyZC1hZG1pbiJ9.vsizK9ZP53to5aL5d1oyFYAiR8Kt1LaQ_Lkt86yPgHp6QloMS_pLCdD7KZi76deQ4ISTFC9Ldc62zslLtY4qgxNvSUiVWj1bWUn2BfCJ-3jPxpd7ZOgr3Gbp2xAFc3xjgm-qZaOydec9i44CbkdiVDoAjL0Au78yt7aHSW8B6plc2fAYNdywtyIOAMhe7f0gjyRaWrGQje2CVduITxZ-2NCwd3EYQNs31OA-zUPFvel_xi_KzdMBuj4z7DdvIK9wPQHyuke0TIs5dHSUEtiY84erLMg5i0ZGXCd019D5Nrsd78fVe_NbO-NThVReskA-jt1FyhAUesZie4GX-2eL3Q
说明:
如果安装Dashboard过程中出现问题,要仔细进行排查,可能pod还没有安装完成,等待一段时间之后,再看看,如果还是不行,则需要考虑一下中途是否有问题,是否需要重新安装。
如果忘记Token,可以通过以下命令获取:
kubectl describe secret -n kubernetes-dashboard (kubectl get secret -n kubernetes-dashboard |grep kubernetes-dashboard-token | awk '{print 1}') |grep token | awk '{print $2}'
11.6 使用火狐浏览器浏览
https://192.168.0.6:30001
部署Dashboard之后,由于证书问题导致无法在浏览器浏览(暂时没有找到解决方案,尝试了网上的方式,不行,以下是尝试的过程(可以跳过))
删除已经部署的Dashboard
- kubectl delete ns kubernetes-dashboard
https://github.com/kubernetes/dashboard/releases
- 阅读参考资料(并执行命令,除了删除命令)
https://blog.51cto.com/10616534/2430512
十二、查找问题方式
12.1 查看Pod详细信息
查看所有Pod
kubectl get pods --all-namespaces
查看状态异常的Pod的详细信息
kubectl describe pod kubernetes-dashboard-8478d57dc6-p7jt7 --namespace=kubernetes-dashboard
说明:
可以看到在哪台Node上创建了容器
12.2 防火墙的问题
建议关闭防火墙
systemctl stop firewalld.service
systemctl disable firewalld.service
说明:
如果不关闭防火墙,可能会造成容器产生错误,如no host to route,是因为防火墙拦截了端口。
12.3 Dashboard 证书过期问题
12.4 Node节点执行kubectl命令出错问题
错误描述信息:
The connection to the server raw.githubusercontent.com was refused - did you specify the right host or port?
需要将master节点的 /etc/kubernetes/admin.conf 文件复制到node节点下。
参考资料
Kubernetes的安装:
https://www.kubernetes.org.cn/6632.html
CentOS Linux 开放端口:
https://www.cnblogs.com/archoncap/p/5402983.html
Kubernetes所有网络插件说明:
https://kubernetes.io/docs/setup/independent/create-cluster-kubeadm/#pod-network