案例解读|迁云的灵魂3问,降多少本,增多少效,真平滑否?

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
对象存储 OSS,20GB 3个月
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介: 近年来,在线教育产业发展十分迅速,高速的发展和国家政策规范的落地执行,给在线教育行业客户带来了新的挑战。如何在保障业务高速发展,达到国家等保要求的同时降本增效,成了行业客户研究的主要课题。本篇文章将以H客户全面上云为案例,详解上云带来的核心价值以及上云方案和步骤,希望能给您的业务带来一定帮助。

  近年来,在线教育产业发展十分迅速,在线教育真正打破了时间和空间的限制,使得学员可以随时随地学习,预期2020年将有超过3000亿的市场规模。随着行业不断成熟,国家政策的规范发展使得在线教育的发展进入调整期,烧钱获客的模式不再持续,在兼顾业务发展的同时要注意成本控制。  
  那就需要注意两大问题。一是服务器资源作为IT基础设施支出的头部预算,如何合理利用服务器资源,按需扩容,节省人力维护成本是关键。第二点是由于教育行业的特殊性,满足国家政策对于互联网教育行业安全等级保护有要求,也是重中之重。围绕这两点,阿里云提供了全面的上云解决方案,帮助客户降本增效。
  下面将以沪江教育为案例进行介绍。沪江教育为中小幼、考研留学及职场精英提供多元化的教育产品,包括课程直播、课程点播、互联网在线学习工具等,截止至2018年底已拥有用户接近2亿,是综合性互联网教育平台。

上云如何降本——减少运维消耗是关键

  客户从最开始一台电脑提供服务,到现在已经拥有分布在多个机房的近千台服务器。随着业务的发展,问题也逐渐暴露,当前以自建IDC为主的模式下,资源利用率不高、部署冗余、运维和基础设备开发人力支出成本高,而且可预见的规模扩大,成本会大幅上升。
  帮助客户上云后,优质的IDC和网络资源随时可用,物理环境零人力投入,相对成本线性,实际TCO更低。
_1

图1 自建机房和阿里云TCO对比曲线



上云如何帮助客户增效

  在线教育行业用户大部分都是闲时在线学习,晚上是业务高峰,其他时间资源利用率不高,另外客户的运营推广活动会带来业务高峰考验基础设施支撑能力。在自建IDC的模式下是IT定义业务体量,运营团队与运维团队在推广活动前需规划业务流量,提前准备服务器来应对。
  上云后,按需伸缩、即开即用的计算资源帮助客户快速应对业务高峰带来的挑战,在数分钟内完成原本需数日甚至更长时间的服务配置和部署工作。阿里云利用特有的快速交付和弹性能力,让客户从全量为业务峰值准备计算力,过渡到贴合业务流量曲线准备计算力,从根本上提升资源利用率和部署效率。同时客户还可根据业务场景组合多种计费类型进一步降低成本(图2)。
_2

图2 利用ECS的弹性计费模型进一步降低TCO



如何通过上云简单达到信息安全等级保护要求

  随着面向未成年人的在线教育渗透率逐步上升,国家出台了多项针对在线教育行业的监管政策。教育部和公安部早在2015年就已经联合发布《关于全面推进教育行业信息安全等级保护工作的通知》,今年9月份教育部等八部门印发《关于引导规范教育移动互联网应用有序健康发展的意见》,其中第二章第四条明确要求教育APP提供者需要获得网络安全等级保护定级备案的证明、等级测评报告后进行备案登记。
  政策的变化为客户带来了新的挑战。为通过等保测评,客户在线下机房专门购置了安全硬件设备并投入人力做整改优化。而选择上云,阿里云提供了合规配套整改的安全方案,包括高防、WAF、众测、安骑士、态势感知等安全产品以及云上安全服务,助力客户低成本高效率完成等保备案工作。

上云千般好,如何平滑迁云是关键

  不管从行业发展趋势还是客户业务发展的需求来看,上云会带来很大的价值,而上云对业务可能带来的影响是客户决策时顾虑最多的点。为保证沪江教育CCTALK实时互动教育平台的平滑上云,线上业务不受影响,我们先深入分析了客户云下架构,再根据业务需求设计云上架构以及可行的迁移的方案,逐步执行。
_3

图3 云下架构示意图


  云下架构中,业务应用服务分别部署在两个机房,由专线打通。自建MySQL采用同机房主备两台的方式做灾备,另外实时转码占用接近20%的总物理服务器资源,此外除了机房几百TB的NAS存储外,还有多达几PB的云存储文件。
_4

图4 云上架构示意图


  云上架构中,考虑到客户的Web应用服务已经实现了微服务化Kubernetes部署,云上对Web应用服务选择容器Kubernetes版无缝迁移,同时采用跨可用区的RDS MySQL高可用版本,相比同机房主备模式,提供更高的可用性。存储使用阿里云OSS,除了提供更高的可用性(不低于99.995%)和数据持久性(不低于99.9999999999%)之外,应用服务访问存储的时候可以走内部流量,节省带宽支出。
_5

图5 迁移示意图


  应用服务迁移过程中,使用阿里云 SMC服务器迁移中心服务将在IDC部署的业务应用服务自动、快速、一站式迁移到云上ECS,同时提供工具支持将自建Kubernetes的应用迁移到云上。
  数据库迁移上,使用 数据传输服务DTS迁移数据,数据库无需停机且支持双向同步,上云切换过程支持数据库的回退方案。云原生数据库POLARDB提供传统数据库一键迁移上云的能力,客户无需修改底层代码就可完成数据库的上云。
  存储服务迁移过程中,客户在上云前有海量的文件,而且大部份是小文件,选择使用阿里云提供的离线和在线的迁移工具来支持文件迁移到OSS,利用CDN的闲时流量迁移,基本没有产生额外的迁移带宽费用(CDN95计费)。对于主要是小文件的bucket,结合 OSS的镜像回源功能,直接将数据源切换到阿里云OSS,无需等待迁移任务的数据同步完成。
  从最后实施结果来看,客户的的整个迁移过程很迅速也很平滑,中间多次测试业务流量在云上云下来回切换对用户使用没有任何影响。

小结:上云的价值

1.成本显著优化
所有资源按需使用,上云后贴合业务流量曲线准备计算资源,成本大幅优化。客户后续还可结合RI实例券使用弹性伸缩产品进一步降低成本。
物理环境零人力投入,部署简化,效率提升,基础设施团队精简,人力投入到业务发展中。
2.更高的可用性和安全性
线下同机房部署主备数据库切换成云上跨可用区的RDS高可用版本,可用性更高。客户的云上跨可用区部署的高可用架构可根据需要随时升级为异地灾备部署,获得更高的可用性。
云上使用WAF,DDOS高防IP等专业安全产品,有专业安全团队更新维护,安全性更高。客户使用免费的防DDOS流量即可满足日常安全需要,在被攻击时,可迅速切换为高版本抵御超大流量的攻击行为,在成本和安全诉求之间找到平衡。
3.业务创新
上云后释放了操作系统,虚拟化,资源调度,网络研发等基础技术栈资源,聚焦到业务发展和业务创新。
云上站在达摩院肩上创新,适用于300+场景的阿里云AI产品家族云上即享.沪江教育研发团队结合教育行业场景使用语音识别,机器翻译等AI产品在做业务尝试和创新。



【附录】

1.本案例涉及到的产品

场景 涉及产品
应用服务 ECS、容器ACK
数据库 RDS MySQL高可用版、PolarDB PostgreSQL
存储 OSS
解析类 云解析、PrivateZone
迁移 DTS数据传输服务、OSS在线迁移服务
其它 SLB负载均衡、CDN、媒体处理(转码)

2.在线教育云上业务参考架构

_6

相关实践学习
容器服务Serverless版ACK Serverless 快速入门:在线魔方应用部署和监控
通过本实验,您将了解到容器服务Serverless版ACK Serverless 的基本产品能力,即可以实现快速部署一个在线魔方应用,并借助阿里云容器服务成熟的产品生态,实现在线应用的企业级监控,提升应用稳定性。
云原生实践公开课
课程大纲 开篇:如何学习并实践云原生技术 基础篇: 5 步上手 Kubernetes 进阶篇:生产环境下的 K8s 实践 相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
目录
相关文章
|
3月前
|
弹性计算 Kubernetes 测试技术
一文掌握弹性与成本的完美平衡 选择正确上云“姿势”,正确实例选型,平滑应对流量高峰
2023云栖大会,阿里云弹性计算弹性计算产品专家王曦、阿里云弹性计算高级技术专家王渊平、阿里云弹性计算高级技术专家田政雄3位嘉宾出席分享,云上付费方式、各规格实例比较应用、ECS如何保障客户满足流量峰值弹性需求等话题。
|
存储 机器学习/深度学习 缓存
从资源弹性到数据弹性,乾象如何将云上量化研究效率提升 40%?
本文将分享乾象量化研究基础平台的具体实践,介绍基于 Fluid+JuiceFSRuntime 的公共云弹性量化投研工作支撑。
从资源弹性到数据弹性,乾象如何将云上量化研究效率提升 40%?
|
存储 传感器 机器学习/深度学习
V2X会是未来趋势吗?看看这种轻量级方法,大幅降低碰撞概率!
本文提出了一种Ledger概念,它通过Ledger信息的广播,在一个资源预留区间(RRI)内向网络中的每辆车传递碰撞信息。碰撞车辆知道它已经与其他车辆相撞,并将在下一个 SPS 期间重新选择。除此之外,其他协议都遵循 SPS。通过引入 Ledger,虽然牺牲了14.29% 的资源,但最终可以降低碰撞概率。本文使用蒙特卡罗模拟器对Ledger系统的性能进行了验证和分析。数值结果表明,遵循 SPS 协议,Ledger 系统可以使碰撞概率在一定数量 RRI 后收敛到零。
V2X会是未来趋势吗?看看这种轻量级方法,大幅降低碰撞概率!
|
Cloud Native 架构师 程序员
为什么团队规模越大,发布反而变慢了|学习笔记
快速学习为什么团队规模越大,发布反而变慢了
77 0
为什么团队规模越大,发布反而变慢了|学习笔记
|
算法 Java 数据挖掘
亿级流量电商系统JVM模型参数预估方案
亿级流量电商系统JVM模型参数预估方案
209 0
亿级流量电商系统JVM模型参数预估方案
|
机器学习/深度学习 存储 弹性计算
冷启动优化:开发者侧降低冷启动影响的方案
冷启动优化:开发者侧降低冷启动影响的方案
14388 0
|
存储 数据采集 算法
|
弹性计算 运维 Kubernetes
边开飞机边换引擎?我们造了个新功能保障业务流量无损迁移
容器化部署应用可以降低企业成本,提升研发效率,解放运维人员。据 Gartner 预计,到 2022 年,将有 75% 的企业将在生产中运行容器化应用程序。Kubernetes 是企业部署容器化应用的首选框架。由于 Kubernetes 部署及运维的复杂性,越来越多的客户选择将业务从 ECS 或者自建的 Kubernetes 迁移到阿里云托管版 Kubernetes —— ACK 中。但是,如何保证业务流量的平滑迁移成为一大挑战。
边开飞机边换引擎?我们造了个新功能保障业务流量无损迁移
|
存储 弹性计算 Kubernetes
案例解读|迁云的灵魂3问,降多少本,增多少效,真平滑否?
近年来,在线教育产业发展十分迅速,高速的发展和国家政策规范的落地执行,给在线教育行业客户带来了新的挑战。如何在保障业务高速发展,达到国家等保要求的同时降本增效,成了行业客户研究的主要课题。本篇文章将以H客户全面上云为案例,详解上云带来的核心价值以及上云方案和步骤,希望能给您的业务带来一定帮助。
4549 0
案例解读|迁云的灵魂3问,降多少本,增多少效,真平滑否?
|
运维 Kubernetes Cloud Native
K8s 集群节点在线率达到 99.9% 以上,扩容效率提升 50%,我们做了这 3 个深度改造
2019 年阿里巴巴核心系统 100% 以云原生方式上云,完美地支撑了 双11 大促。这次上云的姿势很不一般,不仅是拥抱了 Kubernetes,而且还以拥抱 Kubernetes 为契机进行了一系列对运维体系的深度改造。
K8s 集群节点在线率达到 99.9% 以上,扩容效率提升 50%,我们做了这 3 个深度改造