《2023云原生实战案例集》——04 互联网——心动网络 (TapTap)基于SAE实现简单运维、不停机发布和分钟级上线

本文涉及的产品
可观测监控 Prometheus 版,每月50GB免费额度
函数计算FC,每月15万CU 3个月
性能测试 PTS,5000VUM额度
简介: 《2023云原生实战案例集》——04 互联网——心动网络 (TapTap)基于SAE实现简单运维、不停机发布和分钟级上线

image.png 

客户简介

心动创立于2003年,是一家全球游戏开发和发行商,拥有丰富的研发、发行和代理运 营经验。截至2022年中,心动运营38款免费和付费游戏,在全世界拥有5000万月活 跃用户,主要分布在大中华地区、东南亚、北美和南美。2016年,心动推出手机游戏 社区和应用商店TapTap,玩家可以通过官方渠道免费或付费购买下载手机游戏,亦可 在社区中与其他玩家交流,2022年中,TapTap在全球有4400万月活跃用户。

客户痛点

TapTap的广告属于站内的原生广告,与其他非商业化在内容上形态保持高度一致,给用 户更好的体验。比如首页的游戏推荐,发现页的内容推荐,搜索引导页的底纹词,以及 搜索输入时会出现的搜索建议词,还有搜索最后的落地页等等,广告的部分就穿插在这 些战略内容之间。

早期,TapTap绝大部分的后端服务都是部署在ECS,通过Rundeck来进行管理和部署, 在效率和管理上并不是那么理想。在基建升级方案的需求上,主要是4点:

能大幅提升开发运维效率。

以较低的人力成本来满足业务需求。

服务足够可靠,能够具备良好的性能。

因为我们工程目前主要是以Go语言为主,所以在后续基建升级上需要对Go有良好的 支持。

解决方案

预估服务整合了搜索、推荐、广告都需要的模型推理、特征开发以及样本回传的能力, 本身是一个中台型微服务,所有业务线都可以非常低成本的接入目前组内最成熟的线上 预估服务。例如现在的搜索页的推荐词的点击率预估,国际版的游戏点击率预估等。

通过SAE, TapTap的服务快速具备了 ServerLess的能力,因为SAE本身屏蔽了很多资 源管理、环境管理以及基础运维组件管理工作,使得TapTap可以快速地为国内国外的 新场景、新业务上线一套独立的预估服务。

与此同时,TapTap也集成了 SAE的告警平台,事件中心以及日志服务,通过钉钉告警 就可以实时感知线上业务的状态,例如是否发生了 00M还是重启、错误日志之类的。

另外,SAE也是接入了 DubboGo框架使服务直接具备了服务注册发现,IP直连,优雅 上下线等微服务能力。相比之前使用ECS的模式,这套方案在运维管理以及开发上线和 后续的成本管控上都有较大的优势,基本可以覆盖从开发上线后续运维的全流程,大大 节省的组内的开发成本。

image.png

用户价值

简单运维,省心省力:开发可以轻松搞定应用开发、部署、管理全流程,让自己更专 注于业务,也大大节省了运维的投入和成本。

不停机发布+分钟级上线:SAE支持灰度发布、滚动发布的能力,还提供了较为完善的 □ pen API,可以集成到Git中快速部署,使我们的服务具备了分钟级发版的能力,这 个对于新业务尤其具有吸引力。

秒级弹性缩扩容:SAE支持配置像CPU内存、QPSRT定时等不同维度指标的扩 缩策略,可以帮助提升资源利用率。尤其是业务规模大了之后,通过配置更加精细的 弹性策略,可以显著降低机器成本。

多语言微服务能力:SAE提供了 PHPPython. GO等多种运行时,并且基于K8s Service多语言服务注册发现,实现了 Go语言低成本微服务化。

相关产品

ServerLess 应用引擎SAE

相关实践学习
1分钟部署经典小游戏
本场景介绍如何使用Serverless应用引擎SAE 1分钟快速部署经典小游戏。
SAE的功能与使用入门
欢迎来到《SAE的功能与使用入门》,本课程是“云原生Serverless Clouder认证“系列中的第三阶段。课程将向您介绍阿里云Serverless应用引擎(SAE)服务相关的概念、特性与使用方式。通过课程将带您逐步深入探索Serverless世界,借助SAE服务,即使没有丰富的云计算和IT经验,也能够让开发人员在实际业务场景中便捷的掌握如何构建和部署应用程序,快速拥抱Serverless架构,将精力聚焦在应用代码和业务逻辑的实现上。 学习完本课程后,您将能够: 掌握Serverless应用引擎(SAE)的基本概念与核心优势 了解Serverless应用引擎(SAE)的核心功能 掌握使用Serverless应用引擎(SAE)的开发和部署流程 了解Serverless应用引擎(SAE)的适用场景和最佳实践  
相关文章
|
3月前
|
运维 应用服务中间件 持续交付
自动化运维的利器:Ansible实战应用
【9月更文挑战第33天】本文将带你深入理解Ansible,一个强大的自动化运维工具。我们将从基础概念开始,逐步探索其配置管理、任务调度等功能,并通过实际案例演示其在自动化部署和批量操作中的应用。文章旨在通过浅显易懂的语言和实例,为读者揭开Ansible的神秘面纱,展示其在简化运维工作中的强大能力。
196 64
|
2月前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第26天】Prometheus与Grafana是智能运维中的强大组合,前者是开源的系统监控和警报工具,后者是数据可视化平台。Prometheus具备时间序列数据库、多维数据模型、PromQL查询语言等特性,而Grafana支持多数据源、丰富的可视化选项和告警功能。两者结合可实现实时监控、灵活告警和高度定制化的仪表板,广泛应用于服务器、应用和数据库的监控。
315 3
|
3月前
|
机器学习/深度学习 人工智能 运维
企业内训|LLM大模型在服务器和IT网络运维中的应用-某日企IT运维部门
本课程是为某在华日资企业集团的IT运维部门专门定制开发的企业培训课程,本课程旨在深入探讨大型语言模型(LLM)在服务器及IT网络运维中的应用,结合当前技术趋势与行业需求,帮助学员掌握LLM如何为运维工作赋能。通过系统的理论讲解与实践操作,学员将了解LLM的基本知识、模型架构及其在实际运维场景中的应用,如日志分析、故障诊断、网络安全与性能优化等。
104 2
|
4月前
|
运维 安全 应用服务中间件
自动化运维的利剑:Ansible实战应用
【9月更文挑战第24天】在现代IT基础设施的快速迭代与扩展中,自动化运维成为提升效率、保障稳定性的关键。本文将深入探讨Ansible这一流行的自动化工具,通过实际案例分析其如何简化日常运维任务,优化工作流程,并提高系统的可靠性和安全性。我们将从Ansible的基础概念入手,逐步深入到高级应用技巧,旨在为读者提供一套完整的Ansible应用解决方案。
|
21天前
|
数据采集 机器学习/深度学习 人工智能
基于AI的网络流量分析:构建智能化运维体系
基于AI的网络流量分析:构建智能化运维体系
99 13
|
19天前
|
SQL 运维 安全
网络安全等级保护2.0 定级、评测、实施与运维-复习题目资料
本文详细总结了网络信息安全等级保护的练习题,包括单选题、多选题、判断题和简答题。供朋友们参考复习,学习相关领域知识参考。
|
3月前
|
运维 监控 网络协议
|
2月前
|
运维 监控 应用服务中间件
自动化运维的利器:Ansible实战应用
【10月更文挑战第41天】在现代IT运维领域,自动化已成为提高效率、减少错误的关键。Ansible作为一种简单而强大的自动化工具,正被越来越多的企业采纳。本文将通过实际案例,展示如何使用Ansible简化日常运维任务,包括配置管理和批量部署等,旨在为读者提供一种清晰、易懂的自动化解决方案。
35 1
|
2月前
|
运维 Ubuntu 应用服务中间件
自动化运维工具Ansible的实战应用
【10月更文挑战第36天】在现代IT基础设施管理中,自动化运维已成为提升效率、减少人为错误的关键手段。本文通过介绍Ansible这一流行的自动化工具,旨在揭示其在简化日常运维任务中的实际应用价值。文章将围绕Ansible的核心概念、安装配置以及具体使用案例展开,帮助读者构建起自动化运维的初步认识,并激发对更深入内容的学习兴趣。
78 4
|
2月前
|
消息中间件 运维 UED
消息队列运维实战:攻克消息丢失、重复与积压难题
消息队列(MQ)作为分布式系统中的核心组件,承担着解耦、异步处理和流量削峰等功能。然而,在实际应用中,消息丢失、重复和积压等问题时有发生,严重影响系统的稳定性和数据的一致性。本文将深入探讨这些问题的成因及其解决方案,帮助您在运维过程中有效应对这些挑战。
45 1

相关产品

  • Serverless 应用引擎