案例解读|迁云的灵魂3问,降多少本,增多少效,真平滑否?

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
对象存储 OSS,20GB 3个月
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
简介: 近年来,在线教育产业发展十分迅速,高速的发展和国家政策规范的落地执行,给在线教育行业客户带来了新的挑战。如何在保障业务高速发展,达到国家等保要求的同时降本增效,成了行业客户研究的主要课题。本篇文章将以H客户全面上云为案例,详解上云带来的核心价值以及上云方案和步骤,希望能给您的业务带来一定帮助。

  近年来,在线教育产业发展十分迅速,在线教育真正打破了时间和空间的限制,使得学员可以随时随地学习,预期2020年将有超过3000亿的市场规模。随着行业不断成熟,国家政策的规范发展使得在线教育的发展进入调整期,烧钱获客的模式不再持续,在兼顾业务发展的同时要注意成本控制。  
  那就需要注意两大问题。一是服务器资源作为IT基础设施支出的头部预算,如何合理利用服务器资源,按需扩容,节省人力维护成本是关键。第二点是由于教育行业的特殊性,满足国家政策对于互联网教育行业安全等级保护有要求,也是重中之重。围绕这两点,阿里云提供了全面的上云解决方案,帮助客户降本增效。
  下面将以沪江教育为案例进行介绍。沪江教育为中小幼、考研留学及职场精英提供多元化的教育产品,包括课程直播、课程点播、互联网在线学习工具等,截止至2018年底已拥有用户接近2亿,是综合性互联网教育平台。

上云如何降本——减少运维消耗是关键

  客户从最开始一台电脑提供服务,到现在已经拥有分布在多个机房的近千台服务器。随着业务的发展,问题也逐渐暴露,当前以自建IDC为主的模式下,资源利用率不高、部署冗余、运维和基础设备开发人力支出成本高,而且可预见的规模扩大,成本会大幅上升。
  帮助客户上云后,优质的IDC和网络资源随时可用,物理环境零人力投入,相对成本线性,实际TCO更低。
_1

图1 自建机房和阿里云TCO对比曲线



上云如何帮助客户增效

  在线教育行业用户大部分都是闲时在线学习,晚上是业务高峰,其他时间资源利用率不高,另外客户的运营推广活动会带来业务高峰考验基础设施支撑能力。在自建IDC的模式下是IT定义业务体量,运营团队与运维团队在推广活动前需规划业务流量,提前准备服务器来应对。
  上云后,按需伸缩、即开即用的计算资源帮助客户快速应对业务高峰带来的挑战,在数分钟内完成原本需数日甚至更长时间的服务配置和部署工作。阿里云利用特有的快速交付和弹性能力,让客户从全量为业务峰值准备计算力,过渡到贴合业务流量曲线准备计算力,从根本上提升资源利用率和部署效率。同时客户还可根据业务场景组合多种计费类型进一步降低成本(图2)。
_2

图2 利用ECS的弹性计费模型进一步降低TCO



如何通过上云简单达到信息安全等级保护要求

  随着面向未成年人的在线教育渗透率逐步上升,国家出台了多项针对在线教育行业的监管政策。教育部和公安部早在2015年就已经联合发布《关于全面推进教育行业信息安全等级保护工作的通知》,今年9月份教育部等八部门印发《关于引导规范教育移动互联网应用有序健康发展的意见》,其中第二章第四条明确要求教育APP提供者需要获得网络安全等级保护定级备案的证明、等级测评报告后进行备案登记。
  政策的变化为客户带来了新的挑战。为通过等保测评,客户在线下机房专门购置了安全硬件设备并投入人力做整改优化。而选择上云,阿里云提供了合规配套整改的安全方案,包括高防、WAF、众测、安骑士、态势感知等安全产品以及云上安全服务,助力客户低成本高效率完成等保备案工作。

上云千般好,如何平滑迁云是关键

  不管从行业发展趋势还是客户业务发展的需求来看,上云会带来很大的价值,而上云对业务可能带来的影响是客户决策时顾虑最多的点。为保证沪江教育CCTALK实时互动教育平台的平滑上云,线上业务不受影响,我们先深入分析了客户云下架构,再根据业务需求设计云上架构以及可行的迁移的方案,逐步执行。
_3

图3 云下架构示意图


  云下架构中,业务应用服务分别部署在两个机房,由专线打通。自建MySQL采用同机房主备两台的方式做灾备,另外实时转码占用接近20%的总物理服务器资源,此外除了机房几百TB的NAS存储外,还有多达几PB的云存储文件。
_4

图4 云上架构示意图


  云上架构中,考虑到客户的Web应用服务已经实现了微服务化Kubernetes部署,云上对Web应用服务选择容器Kubernetes版无缝迁移,同时采用跨可用区的RDS MySQL高可用版本,相比同机房主备模式,提供更高的可用性。存储使用阿里云OSS,除了提供更高的可用性(不低于99.995%)和数据持久性(不低于99.9999999999%)之外,应用服务访问存储的时候可以走内部流量,节省带宽支出。
_5

图5 迁移示意图


  应用服务迁移过程中,使用阿里云 SMC服务器迁移中心服务将在IDC部署的业务应用服务自动、快速、一站式迁移到云上ECS,同时提供工具支持将自建Kubernetes的应用迁移到云上。
  数据库迁移上,使用 数据传输服务DTS迁移数据,数据库无需停机且支持双向同步,上云切换过程支持数据库的回退方案。云原生数据库POLARDB提供传统数据库一键迁移上云的能力,客户无需修改底层代码就可完成数据库的上云。
  存储服务迁移过程中,客户在上云前有海量的文件,而且大部份是小文件,选择使用阿里云提供的离线和在线的迁移工具来支持文件迁移到OSS,利用CDN的闲时流量迁移,基本没有产生额外的迁移带宽费用(CDN95计费)。对于主要是小文件的bucket,结合 OSS的镜像回源功能,直接将数据源切换到阿里云OSS,无需等待迁移任务的数据同步完成。
  从最后实施结果来看,客户的的整个迁移过程很迅速也很平滑,中间多次测试业务流量在云上云下来回切换对用户使用没有任何影响。

小结:上云的价值

1.成本显著优化
所有资源按需使用,上云后贴合业务流量曲线准备计算资源,成本大幅优化。客户后续还可结合RI实例券使用弹性伸缩产品进一步降低成本。
物理环境零人力投入,部署简化,效率提升,基础设施团队精简,人力投入到业务发展中。
2.更高的可用性和安全性
线下同机房部署主备数据库切换成云上跨可用区的RDS高可用版本,可用性更高。客户的云上跨可用区部署的高可用架构可根据需要随时升级为异地灾备部署,获得更高的可用性。
云上使用WAF,DDOS高防IP等专业安全产品,有专业安全团队更新维护,安全性更高。客户使用免费的防DDOS流量即可满足日常安全需要,在被攻击时,可迅速切换为高版本抵御超大流量的攻击行为,在成本和安全诉求之间找到平衡。
3.业务创新
上云后释放了操作系统,虚拟化,资源调度,网络研发等基础技术栈资源,聚焦到业务发展和业务创新。
云上站在达摩院肩上创新,适用于300+场景的阿里云AI产品家族云上即享.沪江教育研发团队结合教育行业场景使用语音识别,机器翻译等AI产品在做业务尝试和创新。



【附录】

1.本案例涉及到的产品

场景 涉及产品
应用服务 ECS、容器ACK
数据库 RDS MySQL高可用版、PolarDB PostgreSQL
存储 OSS
解析类 云解析、PrivateZone
迁移 DTS数据传输服务、OSS在线迁移服务
其它 SLB负载均衡、CDN、媒体处理(转码)

2.在线教育云上业务参考架构

_6

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
目录
相关文章
|
2月前
|
关系型数据库 Serverless 测试技术
评估特定业务场景下扩缩容操作对性能的影响的方法
通过以上多种方法的综合运用,可以较为全面、准确地评估特定业务场景下扩缩容操作对 PolarDB Serverless 性能的影响。这有助于制定合理的扩缩容策略,确保业务系统在不同资源配置下都能保持良好的性能表现,满足业务需求。
23 1
|
2月前
|
数据挖掘 关系型数据库 Serverless
利用数据分析工具评估特定业务场景下扩缩容操作对性能的影响
通过以上数据分析工具的运用,可以深入挖掘数据背后的信息,准确评估特定业务场景下扩缩容操作对 PolarDB Serverless 性能的影响。同时,这些分析结果还可以为后续的优化和决策提供有力的支持,确保业务系统在不断变化的环境中保持良好的性能表现。
37 2
|
5月前
|
监控 测试技术 持续交付
持续部署的内涵和实施路径问题之定义灰度批次以及每一批的比例和观察时间的问题如何解决
持续部署的内涵和实施路径问题之定义灰度批次以及每一批的比例和观察时间的问题如何解决
|
5月前
|
Docker 容器
典型热点应用问题之追求60秒构建时间目标的问题如何解决
典型热点应用问题之追求60秒构建时间目标的问题如何解决
|
6月前
|
数据库
交易链路设计原则&模式问题之在软件开发中,平衡业务需求和平台能力的边界,如何解决
交易链路设计原则&模式问题之在软件开发中,平衡业务需求和平台能力的边界,如何解决
|
8月前
|
人工智能 算法 搜索推荐
某国有银行业务收益提升30倍,它究竟是怎么做到的!
在激烈的银行竞争环境下,释放存量客户的复购潜力成为关注的重点。然而,目前银行销售理财产品过程中存在一系列问题,其中一个主要原因是过度依赖理财经理的个人经验。国有银行也难以避免这些问题在目标客户定位和营销执行过程中的出现。
|
Cloud Native 前端开发 Serverless
《2023云原生实战案例集》——04 互联网——Wolai 使用函数计算相比传统架构节省了一半以上的费用和人力
《2023云原生实战案例集》——04 互联网——Wolai 使用函数计算相比传统架构节省了一半以上的费用和人力
|
算法 网络协议 测试技术
能力迁移:找到自己的第二曲线
其实并不是反对用新技术比如自动化来提升工作效率,解决重复问题,而是在现实和理想之间要学会取舍。
能力迁移:找到自己的第二曲线
|
存储 传感器 机器学习/深度学习
V2X会是未来趋势吗?看看这种轻量级方法,大幅降低碰撞概率!
本文提出了一种Ledger概念,它通过Ledger信息的广播,在一个资源预留区间(RRI)内向网络中的每辆车传递碰撞信息。碰撞车辆知道它已经与其他车辆相撞,并将在下一个 SPS 期间重新选择。除此之外,其他协议都遵循 SPS。通过引入 Ledger,虽然牺牲了14.29% 的资源,但最终可以降低碰撞概率。本文使用蒙特卡罗模拟器对Ledger系统的性能进行了验证和分析。数值结果表明,遵循 SPS 协议,Ledger 系统可以使碰撞概率在一定数量 RRI 后收敛到零。
V2X会是未来趋势吗?看看这种轻量级方法,大幅降低碰撞概率!
|
Cloud Native 架构师 程序员
为什么团队规模越大,发布反而变慢了|学习笔记
快速学习为什么团队规模越大,发布反而变慢了
107 0
为什么团队规模越大,发布反而变慢了|学习笔记