《泛娱乐行业技术服务白皮书》——四、泛娱乐业务保障与调优最佳实践——4.1游戏运维SRE实践——4.1.3游戏部署的自动化实践

简介: 《泛娱乐行业技术服务白皮书》——四、泛娱乐业务保障与调优最佳实践——4.1游戏运维SRE实践——4.1.3游戏部署的自动化实践

4.1.3 游戏部署的自动化实践

 

传统IT模式的“半人肉”部署实践

游戏运维的早期开服以人肉为主,分区分服务阶拆解的最原始动作包括:游戏服 务端打包->解压游戏包->变更配置修改区服务->初始化数据库(清档)->qa测试->对 外开放入口。如果今天的服务器只有一台两台没有问题,随着服务器数量增多,实践多,实践中经常遇游戏火爆的突发开服事件,而且在2011年后游戏联合运营模式出 现,人肉模式会涌现了很多问题,而且随着开服时间拉长,到一定生命周期后也面临 着繁复的合服工作,游戏运维对开服、合服做了脚本化工作,那也是自动化的早期雏 ,可勉强应对数千台规模的服务部署。

早期的版本部署/变更脚本示例:

image.png

自动化运维体系构成及结构关系图

 

shell半自动化工作,基本可以应对百至千服的常规工作,随着虚拟化普 及,游戏上云后ECS镜像功能。游戏运维会建立每个游戏服角色镜像:这个操作会让 你快速启动另一组服务器,例如你搭建完一组,共三台,游戏服1,游戏服2,游戏服 3,调试完毕后,为每个服做一个镜像,这样你就可以快速启动1组新服,很快就可以 上百组服务器的配置,在需要开新服时,你基本5分钟就可以开一组,所以为每 个不同角色的游戏服留镜像是很有必要的,同时也可以使用跨区复制功能,快速在另 一个region新服,快速完成多region部署,这些工作通过api是可以做到完全自 动化的,基本实现了数千台规模的服务部署

 

基于Ansible的自动化部署实践


最早我们用SSH写很多脚本,要用SSH连过去,也是在某一台机器上执行,不用 目标机上登陆。这种做法在相当一段时间内是我们实际使用的手段,  它实际上比 Puppet有效。但是它有一些问题:管理成本高、脚本会越来越多。部署的过程有很 基础部件需要反复部署,几乎是没法管理。后来我们用了RunDeck,它有界 面、有一定的管理能力。我们还用过Fabric,即批量执行命令,能做到类似部署的事 情。但是,目标机规模大了之后仅有管理的能力是不够的。后来我们又调研过 Salt, 不认为有太大的差别。选择Ansible主要因为丰富的相关支持,包括很多现有的组 和模块和开源的Ansible署和脚本。我们的团队不喜欢纠结。我们发现Ansible没有 太本质区别,就开始用起来。它可以配置系统,部署软件以及协调更高级的IT 务,  例如持续部署,  滚动更新。Ansible适用于管理企业IT基础设施,  从具有少数主 机的小规模到数千个实例的企业环境。具备了简单、强大、无代理的三大优势。简单 说底层就是pssh的批量逻辑,上层封装playbook执行,语法非常接近shell,从历 史的部署模式进行改造非常方便,基本实现了数万台规模的服务部署。


image.png

相关文章
|
2月前
|
机器学习/深度学习 运维 自然语言处理
大模型技术在运维中的知识管理革命
大模型技术在运维中的知识管理革命
211 81
|
8天前
|
运维 监控 安全
ARMS 助力假面科技研发运维提效,保障极致游戏体验
ARMS 助力假面科技研发运维提效,保障极致游戏体验
|
14天前
|
运维 监控 安全
ARMS 助力假面科技研发运维提效,保障极致游戏体验
阿里云 ARMS 团队助力假面科技游戏业务实现全业务、全场景的监控和告警,全面提升监控覆盖率和告警有效率,其中告警平均恢复耗时(MTTR)缩短 50% 以上。
|
10天前
|
运维 监控 安全
ARMS 助力假面科技研发运维提效,保障极致游戏体验
ARMS 助力假面科技研发运维提效,保障极致游戏体验
|
4月前
|
边缘计算 运维 Cloud Native
云原生技术的崛起:重新定义软件开发与运维
云原生技术的崛起:重新定义软件开发与运维
|
4月前
|
运维 监控 安全
运维自动化:提升效率与可靠性的关键技术
在信息技术飞速发展的今天,企业对IT系统的稳定性和高效性要求越来越高。运维自动化作为实现这一目标的重要手段,通过软件工具来模拟、执行和管理IT运维任务,不仅大幅提高了工作效率,还显著增强了系统的可靠性。本文将探讨运维自动化的概念、实施步骤以及面临的挑战,旨在为读者提供一份关于如何有效实施运维自动化的指南。
|
4月前
|
运维 资源调度 监控
提升运维效率的关键技术与实践
在当今快速发展的信息技术时代,运维工作面临着前所未有的挑战和机遇。本文旨在探讨如何通过采用先进的技术和实施最佳实践来提高IT运维的效率和效果。我们将深入分析自动化工具、监控策略、灾难恢复计划以及持续集成/持续部署(CI/CD)等关键领域,展示它们如何协同工作以优化运维流程。此外,文章还将提供一些实际案例研究,帮助读者更好地理解这些概念的应用。无论是对于初创公司还是大型企业,掌握这些技术都将是提升竞争力的关键。
|
4月前
|
机器学习/深度学习 数据采集 安全
道路缝隙识别:智能交通与自动化巡检的技术应用
本文介绍了利用现代计算机视觉和深度学习技术实现道路缝隙自动化识别的方法,涵盖图像采集、预处理、缝隙检测、分类评估及报警报告生成等步骤,旨在提高城市交通管理和道路维护效率。通过卷积神经网络(CNN)模型的构建与训练,实现了对道路裂缝的高效准确识别,有效提升了道路巡检的自动化水平。
|
4月前
|
存储 运维 监控
运维技术深度解析:构建高效、稳定的运维体系
【10月更文挑战第22天】运维技术深度解析:构建高效、稳定的运维体系
531 0
|
4月前
|
人工智能 运维 监控
运维技术深度解析:构建高效、稳定的IT基础设施
【10月更文挑战第22天】运维技术深度解析:构建高效、稳定的IT基础设施
126 0

热门文章

最新文章