欢聚集团成立于2005年,并于2012年在纳斯达克上市。集团从泛娱乐直播切入,孵化出电子竞技游戏直播,并深度布局电商、金融、教育等行业,是一家综合创新的全球化科技互联网公司。
集团深入本地化耕耘产品内容和社交生态,持续为用户构建基于兴趣的社交互动全球化社区,实现全球业务的健康可持续增长,为用户创造更大价值。
在该业务背景下,降本提效成为重要的技术考核标准。
一、现状和挑战
公司现状和挑战主要有以下三个方面。
第一,IDC自建。由于业务隔离,平台共享资源能力弱,资源利用率低。另外,计算和存储绑定导致项目风险高。多年积累导致生态落后,迭代成本高。
第二,开源版本,固定规格。相比商业版本或定制化版本,存在性能损失。另外,版本升级风险高,固定规格使得规模预判强依赖于业务,成本陡增。
第三,专业DBA运维。人力成本高,工作量难以均衡。业务满意度低,人员流动性高。运维过程中,人重度参与,响应周期长,人力成本高。
二、选型和演进
选型过程中,我们主要考虑了IDC自建和RDS两种方案。
IDC自建:可定制性高,稳定性好,权限丰富。
RDS:性价比高,生态完善,能够提供完善的运维治理。域名监控完备,经受过各个行业考验。在数据合规性方面,能够提供完善的安全审计方案。
选型之后,演进过程经历了以下三个阶段。
阶段一:ECS自建阶段。基于ECS搭建开发者集群,完成基于后台的承载。优点在于资源弹性增强,资源共享性提高。存储与计算分开,适用于测试环境和业务验证。缺点在于其运维、生态需要自建,只适用于初期阶段。
阶段二:RDS基础/高可用版阶段。能够满足业务的高并发和高可用,提供完善的监控和数据治理方案,实现资源基本弹性。
阶段三:Serverless MySQL阶段。通过设置CPU区间,实现资源弹性极致,应对波峰波谷明显的场景。
三、 实践落地
确定选型之后,需要将数据从自建IDC迁移到RDS,并且实现业务平滑迁移。
首先,连接自建网络与云上网络,使用DTS产品完成数据双向同步。同步完成后,在两者间增加Lvs proxy。
接着,在应用层面通过Lvs proxy连接数据。应用数据连接完成后,进行切换,完成后下线自建IDC。
集成DAS能够对RDS的健康维度进行监控,并且补充界面展示。
Serverful中DB暴露在所有应用下,VM与DB通过连接池保持连接。
Serverless下FAAS访问DB需要通过RESTAPI,鉴权通过RAM/AK/SK。
RDS实践达到增效降本的目的,运维人效提升70%至80%,投入成本减少40%至50%。