《泛娱乐行业技术服务白皮书》——四、泛娱乐业务保障与调优最佳实践——4.1游戏运维SRE实践——4.1.3游戏部署的自动化实践

简介: 《泛娱乐行业技术服务白皮书》——四、泛娱乐业务保障与调优最佳实践——4.1游戏运维SRE实践——4.1.3游戏部署的自动化实践

4.1.3 游戏部署的自动化实践

 

传统IT模式的“半人肉”部署实践

游戏运维的早期开服以人肉为主,分区分服务阶拆解的最原始动作包括:游戏服 务端打包->解压游戏包->变更配置修改区服务->初始化数据库(清档)->qa测试->对 外开放入口。如果今天的服务器只有一台两台没有问题,随着服务器数量增多,实践多,实践中经常遇游戏火爆的突发开服事件,而且在2011年后游戏联合运营模式出 现,人肉模式会涌现了很多问题,而且随着开服时间拉长,到一定生命周期后也面临 着繁复的合服工作,游戏运维对开服、合服做了脚本化工作,那也是自动化的早期雏 ,可勉强应对数千台规模的服务部署。

早期的版本部署/变更脚本示例:

image.png

自动化运维体系构成及结构关系图

 

shell半自动化工作,基本可以应对百至千服的常规工作,随着虚拟化普 及,游戏上云后ECS镜像功能。游戏运维会建立每个游戏服角色镜像:这个操作会让 你快速启动另一组服务器,例如你搭建完一组,共三台,游戏服1,游戏服2,游戏服 3,调试完毕后,为每个服做一个镜像,这样你就可以快速启动1组新服,很快就可以 上百组服务器的配置,在需要开新服时,你基本5分钟就可以开一组,所以为每 个不同角色的游戏服留镜像是很有必要的,同时也可以使用跨区复制功能,快速在另 一个region新服,快速完成多region部署,这些工作通过api是可以做到完全自 动化的,基本实现了数千台规模的服务部署

 

基于Ansible的自动化部署实践


最早我们用SSH写很多脚本,要用SSH连过去,也是在某一台机器上执行,不用 目标机上登陆。这种做法在相当一段时间内是我们实际使用的手段,  它实际上比 Puppet有效。但是它有一些问题:管理成本高、脚本会越来越多。部署的过程有很 基础部件需要反复部署,几乎是没法管理。后来我们用了RunDeck,它有界 面、有一定的管理能力。我们还用过Fabric,即批量执行命令,能做到类似部署的事 情。但是,目标机规模大了之后仅有管理的能力是不够的。后来我们又调研过 Salt, 不认为有太大的差别。选择Ansible主要因为丰富的相关支持,包括很多现有的组 和模块和开源的Ansible署和脚本。我们的团队不喜欢纠结。我们发现Ansible没有 太本质区别,就开始用起来。它可以配置系统,部署软件以及协调更高级的IT 务,  例如持续部署,  滚动更新。Ansible适用于管理企业IT基础设施,  从具有少数主 机的小规模到数千个实例的企业环境。具备了简单、强大、无代理的三大优势。简单 说底层就是pssh的批量逻辑,上层封装playbook执行,语法非常接近shell,从历 史的部署模式进行改造非常方便,基本实现了数万台规模的服务部署。


image.png

相关文章
|
10月前
|
传感器 边缘计算 运维
AR 虚实叠加技术在工业设备运维中的实现流程方案
AR技术通过虚实信息融合,实现工业设备参数可视化、故障立体化、操作直观化,提升运维效率与精度。结合物联网与数字孪生,打造智能运维新范式。
|
8月前
|
数据采集 运维 监控
爬虫与自动化技术深度解析:从数据采集到智能运维的完整实战指南
本文系统解析爬虫与自动化核心技术,涵盖HTTP请求、数据解析、分布式架构及反爬策略,结合Scrapy、Selenium等框架实战,助力构建高效、稳定、合规的数据采集系统。
1261 62
爬虫与自动化技术深度解析:从数据采集到智能运维的完整实战指南
|
10月前
|
传感器 人工智能 运维
AR技术电力智慧运维白皮书
AR技术正重塑电力运维模式,通过“端-边-云”协同系统,实现设备可视化、远程协作与智能预警,大幅提升效率与安全性,推动电力行业迈入智能运维新时代。
|
10月前
|
运维 监控 jenkins
企业服务交付慢?运维技术其实就是“加速器”
企业服务交付慢?运维技术其实就是“加速器”
219 5
|
机器学习/深度学习 运维 自然语言处理
大模型技术在运维中的知识管理革命
大模型技术在运维中的知识管理革命
792 81
|
人工智能 运维 监控
HarmonyOS NEXT~鸿蒙系统运维:全面解析与最佳实践
本书《HarmonyOS NEXT~鸿蒙系统运维:全面解析与最佳实践》深入探讨了鸿蒙系统的运维管理。从架构特点到实际操作,涵盖分布式能力、性能优化、安全维护及故障排查。内容包括设备管理、系统监控、安全管理等核心任务,提供常见问题解决方案与工具推荐。面对未来超级终端和AI赋能的挑战,运维人员需不断学习,以充分发挥鸿蒙的分布式优势,为用户带来流畅体验。
909 8
|
人工智能 API 开发工具
GitHub官方开源MCP服务!GitHub MCP Server:无缝集成GitHub API,实现Git流程完全自动化
GitHub MCP Server是基于Model Context Protocol的服务器工具,提供与GitHub API的无缝集成,支持自动化处理问题、Pull Request和仓库管理等功能。
3307 2
GitHub官方开源MCP服务!GitHub MCP Server:无缝集成GitHub API,实现Git流程完全自动化
|
机器学习/深度学习 运维 自然语言处理
大模型也能当“运维警察”?——大模型技术在异常检测中的应用
大模型也能当“运维警察”?——大模型技术在异常检测中的应用
2338 13
|
测试技术 Python
Python接口自动化测试中Mock服务的实施。
总结一下,Mock服务在接口自动化测试中的应用,可以让我们拥有更高的灵活度。而Python的 `unittest.mock`库为我们提供强大的支持。只要我们正确使用Mock服务,那么在任何情况下,无论是接口是否可用,都可以进行准确有效的测试。这样,就大大提高了自动化测试的稳定性和可靠性。
454 0
|
边缘计算 运维 Cloud Native
云原生技术的崛起:重新定义软件开发与运维
云原生技术的崛起:重新定义软件开发与运维

热门文章

最新文章