武汉掌游科技有限公司隶属于盛趣游戏(原盛大游戏)旗下,是一家经营手游发行、深度运营及综合买量的互联网游戏公司。自2014年成立至今,已成功运营超过1000款手游产品,拥有超过1亿游戏用户,活跃用户突破千万。
系统重构后产生新的需求
掌游科技有SaaS游戏发行运营平台,帮助游戏厂商通过大数据分析更好的运营游戏。随着业务量的不断上涨,之前单数据库的系统架构逐渐出现了性能瓶颈。
为了能更好的支撑业务,掌游科技将单库按业务拆分为了四个数据库,整个系统也因为分库而进行了重构。但是重构后的系统经过测试发现有很多问题,几次上线后都出现了不稳定的情况,并且由于业务复杂,开发人员众多,很难快速、全面的发现系统Bug和性能约束点,所以急需通过APM工具来发现系统中存在的各个性能约束点。
掌游科技期望APM工具能具备以下五点特性:
• 快速无侵入的接入方式:期望最大限度的不改动系统代码,以无侵入、无感知的方式将监控系统接入现有系统;
• 系统性能低损耗:接入的监控系统不对能宿主系统产生过高的性能损耗,期望不超过5%;
• 可视化的配置操作方式:不期望繁琐的、通过命令形式的配置。期望可以通过Web控制台的方式方便的进行配置,比如采样率、SQL提取规则、业务监控配置等;
• 全方位的应用监控能力:期望从应用层面、节点层面、接口层面、主机层面多维度监控系统。比如应用的整体健康度,接口的调用次数、响应时间、慢SQL分析、异常分析、JVM分析、内存快照分析、CPU/内存/IO分析等;
• 支持PHP语言:客户主要使用PHP语言进行开发,希望监控系统可以全面支持PHP语言的各个组件和框架。比如CURL、PDO、Mysqli、Yar Client、GRPC Client、Predis Client、Memcache Extension等。
解决方案
阿里云自研的应用实时监控服务ARMS完美的契合了客户的诸多痛点,通过Agent的方式无侵入的、快速的接入客户系统,通过白屏化的方式进行设置,提供各种丰富完善的视图协助客户全方位监控系统,并且ARMS结合众多客户场景和专家经验,提供智能诊断功能。帮助客户快速、准确的发现和定位到了系统重构后的很多性能约束点和隐患,让客户有的放矢的对系统进行优化。
1. 性能瓶颈和Bug一目了然:无论从CPU、内存、磁盘、网络、JVM GC、JVM堆内存、内存快照分析的主机层面还是从接口响应时间、请求数、错误数、异常分析、上下游接口、接口快照、调用链路、线程剖析的接口层面,亦或是慢SQL分析、数据库连接数、CPU/内存/磁盘使用率、网络流入/出流量监控的存储层面,以及NoSQL、MQ监控等。将系统360度无死角的监控起来,所有性能问题都无所遁形。
2. 提前预知系统问题:ARMS提供了完善的预警通知功能,可以基于主机监控、JVM监控、异常接口调用、应用调用统计、数据库指标等多个指标类型下几十钟触发条件来灵活的设置预警规则。同时提供多样化的通知方式以满足不同客户的通知需求。
3. 支持PHP:目前开源的APM工具对PHP支持的都不够完善,无论在无侵入接入方面,还是支持的组件方面,面对PHP语言构建的系统,都不能很好的支撑形成监控链路闭环。ARMS在对PHP语言系统的监控方面已经沉淀多年,绝大多数PHP的框架和组件都已支持,有很完善的问题分析定位的链路闭环和最佳实践。
【更多精彩】
1.中间件爆款一折起,还有阿里巴巴十年最佳实践深度解密,点击马上了解:https://www.aliyun.com/activity/daily/commercial?spm=5176.20960838.0.0.6a54305etoEn4D
2.【填问卷领淘公仔】点击马上填写问卷:
https://survey.aliyun.com/apps/zhiliao/YmW95Gk8bU
【加入行业实战交流钉钉群】
阿里云专门成立了“互联网架构升级实战课”钉钉群,每周邀请一位阿里云专家在群内进行行业最佳实践直播,每天分享行业前沿干货,钉钉扫码马上加入。