如何使用 Terraform 管理容器服务 Kubernetes 集群

本文涉及的产品
性能测试 PTS,5000VUM额度
注册配置 MSE Nacos/ZooKeeper,118元/月
函数计算FC,每月15万CU 3个月
简介: Terraform 是一款 Infrastructure as Code 的工具,可以将云端资源代码化。本文将为大家讲解如何使用 Terraform 来管理容器服务 Kubernetes 集群。

原文作者:治世
原文链接
更多云原生技术资讯可关注阿里巴巴云原生技术圈

介绍

Terraform 是一款 Infrastructure as Code 的工具,可以将云端资源代码化。关于 Terraform 的基本介绍本文不再赘述,有兴趣的同学可以参考 《云生态下的基础架构资源管理利器Terraform》 等云栖社区的优秀文章。阿里云容器服务团队也快速在Terraform上支持了Kubernetes集群的创建。关于标准版和Serverless版集群如何使用Terraform 请参考以下文章

前置检查

  • Terraform v0.12.8+
  • terraform-provider-alicloud 1.57.2+ (早期版本不支持配置日志服务)

托管版集群

首先我们打开《阿里云 Terraform Provider 文档 -Managed Kubernetes》的帮助文档,可以看到该资源 Resource 提供的参数列表。参数分为入参 Argument 和出参 Attributes。入参列表内包含了必填参数以及可选参数,例如 name 和 name_prefix 就是一对必填参数,但它们互斥,即不能同时填写。我们对照文档中的参数列表 Argument Reference,先草拟出一个集群的描述,为了方便起见,我把填写每个参数的理由都注释在代码中。

  • 资源描述
# 引入阿里云 Terraform Provider
provider "alicloud" {
  # 填入您的账号的 Access Key
  access_key = "FOO"
  # 填入您的账号 Secret Key
  secret_key = "BAR"
  # 填入想创建的 Region
  region     = "cn-hangzhou"
  # 可选参数,默认不填就使用最新版本。不建议该处指定版本,除非很明确知道每个版本的能力
  version    = "v1.57.2"
}
# 必要的资源标识
# alicloud_cs_managed_kubernetes 表明是托管版 Kubernetes 集群
# k8s 代表该资源实例的名称
resource "alicloud_cs_managed_kubernetes" "k8s" {
  # 集群名称,可以带中划线,一个账户内的集群名称不能相同
  name = "tf-managed-kubernetes-20191017"
  # 交换机ID ,此处可以输入同一VPC下的多个交换机,最多可以输入三个交换机
  vswitch_ids  = ["vsw-2zelx9t6i28pqe3cca3rv"]
  # 是否配置公网访问能力。如果您当前的交换机已配置SNAT规则,或者通过其他代理的方式可以访问公网,则此处可以设置为false,反之,则设置为true,让系统来完成访问公网的配置
  new_nat_gateway = true
  # 工作节点的实例规则配置,可以选择多个实例规格
  worker_instance_types = ["ecs.c5.xlarge"]
  # 工作节点个数,对于Managed Kubernetes集群至少需要2个工作节点
  worker_number = 2
  # 节点的登陆密码
  password = "Yourpassword1234"
  # 集群的Pod 网段地址,该地址不可以和VPC网段冲突,同时也不能和相同VPC其他集群网段冲突
  pod_cidr = "10.20.0.0/16"
  # 集群的服务网段地址,该网段不能和pod网段冲突
  service_cidr = "172.21.0.0/20"
  # 是否安装云监控插件
  install_cloud_monitor = true
  # 是否暴露Api Server公网访问
  slb_internet_enabled = true
  # 工作节点系统盘类型
  worker_disk_category  = "cloud_ssd"
  # 工作节点数据盘类型
  worker_data_disk_category = "cloud_ssd"
  # 工作节点数据盘大小
  worker_data_disk_size =  200
  # 是否开启日志服务
  log_config {
    # 日志类型需要是SLS
    type = "SLS"
    # SLS project名称,如果指定则需要保证该project存在。
    project = "tf-managed-sls"
  }
}
  • 资源检查
    我们可以将以上的配置保存为一个 main.tf 描述文件,在该文件的当前目录下执行 terraform plan 进行资源检查

5.png

  • 初始化provier
    再检查正常之后,我们执行 terraform init 先来初始化provider

6.png

  • 资源创建
    接下来使用terraform apply 执行创建

7.png

此时terraform apply 会根据我们的 main.tf 描述文件计算出需要执行的操作,上述显示将会创建一个 alicloud_cs_managed_kubernetes.k8s的资源,需要我们输入 yes 来确认创建。确认创建后,创建大约会耗时十分钟,terraform 会输出类似下面的日志。
8.png

在命令行中出现如下信息的时候,表明集群已创建成功。
9.png

此时我们也可以登录控制台后在控集群列表中看到集群。
10.png

  • 修改资源
    在 Terraform Provider 中,我们提供了一部分参数的修改能力,一般情况下,所有非 Force New Resouce(强制新建资源)的参数都可以被修改。下面我们我们演示通过修改节点数来完成一次扩容动作。
resource "alicloud_cs_managed_kubernetes" "k8s" {
  # 不变的部分此处省略不写
  worker_number = 5
}

调整完模板后,我们再次执行terraform apply ,我们会看到提示变化的点
11.png

更新动作同样需要我们输入 yes 来确认更新,此时我们可以通过控制台看到集群已经处于更新中状态了。
12.png

大概需要五分钟左右,系统就会完成新购节点并且加入到集群中,完成后,我们通过控制台可以看到节点数发生了变化。
13.png

  • 资源释放
    当我们不再需要该集群的时候,我们可以执行 terraform destroy 来销毁资源

14.png

总结

通过以上操作我们可以完成托管版集群的创建和销毁工作。但是在实际使用过程中,模板比这个更加的复杂,例如一些输入参数是通过变量的方式传入的,这样一个模板可以适配更多的场景。
由于我们的服务仍然在不断的演进中,同时Terraform也会不断的更新迭代,可以关注社区我们版本的迭代。

阿里巴巴云原生关注微服务、Serverless、容器、Service Mesh 等技术领域、聚焦云原生流行技术趋势、云原生大规模的落地实践,做最懂云原生开发者的技术圈。”

相关实践学习
巧用云服务器ECS制作节日贺卡
本场景带您体验如何在一台CentOS 7操作系统的ECS实例上,通过搭建web服务器,上传源码到web容器,制作节日贺卡网页。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
6天前
|
弹性计算 人工智能 资源调度
DeepSeek大解读系列公开课上新!阿里云专家主讲云上智能算力、Kubernetes容器服务、DeepSeek私有化部署
智猩猩「DeepSeek大解读」系列公开课第三期即将开讲,聚焦阿里云弹性计算助力大模型训练与部署。三位专家将分别讲解智能算力支撑、Kubernetes容器服务在AI场景的应用实践、以及DeepSeek一键部署和多渠道应用集成,分享云计算如何赋能大模型发展。欲观看直播,可关注【智猩猩GenAI视频号】预约。 (239字符)
|
1月前
|
人工智能 运维 监控
容器服务Kubernetes场景下可观测体系生产级最佳实践
阿里云容器服务团队在2024年继续蝉联Gartner亚洲唯一全球领导者象限,其可观测体系是运维的核心能力之一。该体系涵盖重保运维、大规模集群稳定性、业务异常诊断等场景,特别是在AI和GPU场景下提供了全面的观测解决方案。通过Tracing、Metric和Log等技术,阿里云增强了对容器网络、存储及多集群架构的监控能力,帮助客户实现高效运维和成本优化。未来,结合AI助手,将进一步提升问题定位和解决效率,缩短MTTR,助力构建智能运维体系。
|
4月前
|
Prometheus Kubernetes 监控
k8s部署针对外部服务器的prometheus服务
通过上述步骤,您不仅成功地在Kubernetes集群内部署了Prometheus,还实现了对集群外服务器的有效监控。理解并实施网络配置是关键,确保监控数据的准确无误传输。随着监控需求的增长,您还可以进一步探索Prometheus生态中的其他组件,如Alertmanager、Grafana等,以构建完整的监控与报警体系。
317 62
|
4月前
|
Prometheus Kubernetes 监控
k8s部署针对外部服务器的prometheus服务
通过上述步骤,您不仅成功地在Kubernetes集群内部署了Prometheus,还实现了对集群外服务器的有效监控。理解并实施网络配置是关键,确保监控数据的准确无误传输。随着监控需求的增长,您还可以进一步探索Prometheus生态中的其他组件,如Alertmanager、Grafana等,以构建完整的监控与报警体系。
182 60
|
3月前
|
存储 Kubernetes 网络协议
k8s的无头服务
Headless Service 是一种特殊的 Kubernetes 服务,其 `spec:clusterIP` 设置为 `None`,不会分配 ClusterIP,通过 DNS 解析提供服务发现。与普通服务不同,Headless Service 不提供负载均衡功能,每个 Pod 都有唯一的 DNS 记录,直接映射到其 IP 地址,适用于有状态应用的场景,如与 StatefulSet 一起部署数据库。示例中通过创建 Nginx 的 StatefulSet 和 Headless Service,展示了如何直接访问单个 Pod 并进行内容修改。
93 3
|
4月前
|
Prometheus Kubernetes 监控
k8s学习--kubernetes服务自动伸缩之水平伸缩(pod副本伸缩)HPA详细解释与案例应用
k8s学习--kubernetes服务自动伸缩之水平伸缩(pod副本伸缩)HPA详细解释与案例应用
187 1
k8s学习--kubernetes服务自动伸缩之水平伸缩(pod副本伸缩)HPA详细解释与案例应用
|
3月前
|
存储 Kubernetes Devops
Kubernetes集群管理和服务部署实战
Kubernetes集群管理和服务部署实战
105 0
|
4月前
|
负载均衡 Kubernetes 区块链
随机密码生成器+阿里k8s负载均衡型服务加证书方法+移动终端设计+ico生成器等
随机密码生成器+阿里k8s负载均衡型服务加证书方法+移动终端设计+ico生成器等
90 1
|
4月前
|
Kubernetes 应用服务中间件 nginx
k8s学习--kubernetes服务自动伸缩之水平收缩(pod副本收缩)VPA策略应用案例
k8s学习--kubernetes服务自动伸缩之水平收缩(pod副本收缩)VPA策略应用案例
107 1
|
4月前
|
Kubernetes 监控 调度
k8s学习--kubernetes服务自动伸缩之垂直伸缩(资源伸缩)VPA详细解释与安装
k8s学习--kubernetes服务自动伸缩之垂直伸缩(资源伸缩)VPA详细解释与安装
163 1

相关产品

  • 容器计算服务
  • 容器服务Kubernetes版