【Terraform实现云服务基础设施既代码(IaC)案例实战-1】:树苗科技公司的自动化转型之旅

简介: 背景树苗科技公司业务上云2年有余,随着技术的不断发展。运维团队支持业务变更配置、开资源、删资源等过程加班到深夜一两点已是家常便饭。为了进一步提升工作效率,运维总监张三决定对当前业务交付路径进行统一梳理,借助IaC的理念和Terraform自动化工具逐步实施运维生产自动化,改善组内成员频繁加班的现状。...

背景

树苗科技公司业务上云2年有余,随着技术的不断发展。运维团队支持业务变更配置、开资源、删资源等过程加班到深夜一两点已是家常便饭。为了进一步提升工作效率,运维总监张三决定对当前业务交付路径进行统一梳理,借助IaC的理念和Terraform自动化工具逐步实施运维生产自动化,改善组内成员频繁加班的现状。

期望:

  1. 能够建设生产网和测试网络的业务交付自动化

  2. 能够有一个轻量级前段给业务团队自己申请

  3. 能够有权限管理和版本控制,防止一键删资源跑路的情况

  4. 能够使用容器技术,在短时间内交付可扩容的业务脚本

组织背景

image.png

树苗科技公司共有四个部门,运维部门,品种研发部门、企业财务部门和企业安全部门。

运维部门:主要负责云上资源的管理工作,支撑各部门的业务。

品种研发部门:主要负责新品种研发和产品发布上市过程。会与运维部门频繁交付。经常会申请开通测试环境,新业务建设和旧业务扩容等需求。

业务痛点

  1. 组织发展快,云上资源增速大于给运维团队的人员配比

  2. 重复劳动多,业务方需求天天变,运维成了苦力活

  3. 老板挑战多,天天开个资源这么慢,还经常出问题

  4. 业务价值难讲,基础设施运维都不需要了,哪还有那么多事?

  5. 全责不对等,运维团队没有对业务团队的约束力,只能被动响应。还要应付安全、合规、审计、财务等多方的挑战。

业务构思:

因此,张三安排运维主管李四来主导整个调研和落地工作。 李四经过初步设计后,给出一张简单的架构图,并开始选取技术和工具对试点项目落地。在未来,希望也能与dingding等移动办公软件集成,实现审批消息推送。

image.png

技术和工具

李四对市场上的技术进行了选型和调研,决定采用下面的技术和工具手段进行。

工具名称

用途

链接

备注

Terraform

用作基础设施生产交付的手段,能够适应多云环境,社区活跃度较好。

https://registry.terraform.io/providers/aliyun/alicloud/latest/docs/resources/instance

采用最新版,符合需求后不做频繁更新。

Gitlab

版本控制,权限管控,审批集成

https://about.gitlab.com/

从代码的私有性上来看,GitLab 是一个更好的选择。但是对于开源项目而言,GitHub 依然是代码托管的首选。

Webhook

托管运行代码,跟terraform的plan,apply指令集成。是gitlab的众多集成项目之一。

https://docs.gitlab.com/ee/user/project/integrations/webhooks.html

任意一种前端构建工具

基于python的轻量级前段,轻易可以搭建表单等业务。

不需要太复杂,越简单越好。主要是表单建设。

期望效果

  1. “森林公司”的基础设施选型逐步收敛,由运维团队制定主流的基础设施框架。

  2. 交付周期从5个工作日缩减为2小时内

  3. 对于到期项目,能够快速释放

  4. 运维人员从此躺着干活,更多精力投入到更有成长和价值的事情上。

相关材料

阿里云Terraform官网:

https://registry.terraform.io/providers/aliyun/alicloud/latest/docs/resources/instance

Gitlab官网:

https://docs.gitlab.com/ee/install/

Gitlab-runner:

https://docs.gitlab.com/runner/install/

Hashicorp/terraform docker镜像

https://hub.docker.com/r/hashicorp/terraform/tags

Docker安装:

https://docs.docker.com/desktop/mac/install/

阿里云镜像服务:

https://cr.console.aliyun.com/cn-shanghai/instances/mirrors

相关文章
|
3月前
|
存储 关系型数据库 测试技术
玩转n8n测试自动化:核心节点详解与测试实战指南
n8n中节点是自动化测试的核心,涵盖触发器、数据操作、逻辑控制和工具节点。通过组合节点,测试工程师可构建高效、智能的测试流程,提升测试自动化能力。
|
3月前
|
Web App开发 前端开发 JavaScript
Playwright极速UI自动化实战指南
Playwright告别Selenium痛点,以智能等待、强大选择器、网络拦截与多设备模拟四大利器,提升自动化效率与稳定性。本文通过实战代码详解其加速秘籍,助你构建高效、可靠的UI测试方案。
|
4月前
|
Web App开发 人工智能 JavaScript
主流自动化测试框架的技术解析与实战指南
本内容深入解析主流测试框架Playwright、Selenium与Cypress的核心架构与适用场景,对比其在SPA测试、CI/CD、跨浏览器兼容性等方面的表现。同时探讨Playwright在AI增强测试、录制回放、企业部署等领域的实战优势,以及Selenium在老旧系统和IE兼容性中的坚守场景。结合六大典型场景,提供技术选型决策指南,并展望AI赋能下的未来测试体系。
|
2月前
|
弹性计算 人工智能 前端开发
在阿里云ECS上部署n8n自动化工作流:U2实例实战
本文介绍如何在阿里云ECS的u2i/u2a实例上部署开源工作流自动化平台n8n,利用Docker快速搭建并配置定时任务,实现如每日抓取MuleRun新AI Agent并推送通知等自动化流程。内容涵盖环境准备、安全组设置、实战案例与优化建议,助力高效构建低维护成本的自动化系统。
682 5
|
2月前
|
数据采集 运维 监控
爬虫与自动化技术深度解析:从数据采集到智能运维的完整实战指南
本文系统解析爬虫与自动化核心技术,涵盖HTTP请求、数据解析、分布式架构及反爬策略,结合Scrapy、Selenium等框架实战,助力构建高效、稳定、合规的数据采集系统。
爬虫与自动化技术深度解析:从数据采集到智能运维的完整实战指南
|
4月前
|
人工智能 缓存 测试技术
Playwright进阶指南 (6) | 自动化测试实战
2025企业级测试解决方案全面解析:从单元测试到千级并发,构建高可用测试体系。结合Playwright智能工具,解决传统测试维护成本高、环境依赖强、执行效率低等痛点,提升测试成功率,内容从测试架构设计、电商系统实战框架、高级测试策略、Docker化部署、CI/CD集成及AI测试应用,助力测试工程师掌握前沿技术,打造高效稳定的测试流程。
Playwright进阶指南 (6) | 自动化测试实战
|
3月前
|
人工智能 数据可视化 测试技术
AI 时代 API 自动化测试实战:Postman 断言的核心技巧与实战应用
AI 时代 API 自动化测试实战:Postman 断言的核心技巧与实战应用
537 11
|
4月前
|
传感器 人工智能 JavaScript
Playwright实战:写UI自动化脚本,速度直接起飞
简介: 测试工程师老王因UI自动化问题深夜奋战,反映出传统测试工具的局限性。微软开源的Playwright凭借智能等待、跨域操作、移动端模拟与网络拦截等强大功能,正迅速取代Selenium,成为新一代自动化测试标准。其稳定高效的设计显著降低维护成本,助力企业构建高质量测试流程。
|
5月前
|
供应链 搜索推荐 安全
淘宝/京东/亚马逊API实战:中小商家的自动化生存指南
电商API是连接电商平台、商家、支付与物流系统的技术桥梁,具备商品管理、订单处理、用户服务、营销支持等功能,助力业务自动化与数据驱动决策,成为电商生态中提升效率与创新的关键基础设施。
|
5月前
|
人工智能 JavaScript 前端开发
Playwright自动化测试系列课(5) | ​​调试神器实战:Trace Viewer 录屏分析 + AI 辅助定位修复​
Playwright 的 Trace Viewer 提供录屏级追踪,还原测试全过程,帮助定位偶发故障。结合 AI 实现自动修复,大幅提升调试效率,成为自动化测试利器。

热门文章

最新文章

推荐镜像

更多