全面上云这条路,洋葱学院已经走了近7年

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 延期开学的这段时间里,广大学生学习时间较为集中,面对大流量、高并发访问需求,洋葱学院需要确保业务稳定性,采用阿里云容器服务与云数据库融合解决方案,在应用不变的情况下,快速平稳实现扩容的问题。阿里云容器服务可以在几分钟内扩充底层资源,满足快速部署数千个应用实例的需求。

洋葱学院在2013年末成立,原名洋葱数学,是一家K12在线教育公司。课程里没有真人老师授课,而是采用100%人机交互学习方式,每节课5-8分钟动画视频的形式精讲一个知识点或解题思维,希望有趣生动的讲解方式让更多的孩子们爱上学习。

创新且锐意进取,是这个公司的基因。

洋葱学院由杨临风、朱若辰和李诺联合创办,团队希望通过技术方式促进教育均衡。在创立之初,团队就做出了一个意识超前的决定:整套业务系统均基于阿里云搭建。

_1

要知道,2013年,能选择全面上云的中国企业屈指可数。

上云先锋洋葱学院这一路走来,也是和阿里云一同携手成长的难忘历程。几年前,由于某个特殊使用场景,线上业务受到严重影响,洋葱学院和阿里云紧急沟通、快速排查问题,阿里云云数据库的专家同学进行了重启、备份等一系列工作。

早先,洋葱学院起步于初中数学、物理课程,但是随着不断发展,开始加入语文和英语等学科,这些课程特点不同、相应的学习流程不同。除了早先选用的ECS云服务、SLB负载均衡、阿里云云数据库等经典基础产品之外,洋葱学院也尝试将新的业务应用搭建于一些新兴阿里云产品,如ACK容器服务、RSS弹性伸缩、SLS日志服务、Blink实时计算、ARMS前端监控等,来满足日趋复杂和多样化的业务需求。

如今,从初中理科逐渐扩展到小初高全学段全学科,为130多万教师以及3600多万的中小学生提供24小时在线的“云课堂”。

疫情大考突如其来,IT架构稳如泰山

疫情期间(近一个月以来),有超过700万学生、35万教师使用洋葱学院APP在线学习或辅助授课,同时还将课程资源开放给学习强国、快手等第三方平台播放,帮助更广泛的学生远程学习。

能应对猝不及防的疫情流量洪峰,洋葱都做了怎样的努力、下足了哪些功夫呢?

在线教育业务的一个重要特点,就是波峰波谷比较规律,可预测。在学校下课或放假时期,业务会达到上升,洋葱学院便会在数分钟扩容云上资源,待学生返校上课之时,再根据业务情况释放资源,这样持续保持较高的资源利用率,既节省成本又确保业务响应。

3年前,洋葱学院开始尝试微服务改造,将复杂的单体架构进行拆分和解耦。同时采用容器技术,并也将swarm迁移至阿里云容器服务ACK之上,原本每个模块都对应一套ECS与SLB,但是随着微服务越拆越细,开始出现资源浪费的情况,而且调度复杂度都在迅速膨胀。容器服务可以根据不同模块的配置所需,资源分配更加合理,按照定义规则自动弹性伸缩避免了复杂的调度维护。

_2

容器的弹性

基本功夯实的基础上,洋葱学院还做了一些方案优化和升级。

延期开学的这段时间里,广大学生学习时间较为集中,面对大流量、高并发访问需求,洋葱学院需要确保业务稳定性,采用阿里云容器服务与云数据库融合解决方案,在应用不变的情况下,快速平稳实现扩容的问题。阿里云容器服务可以在几分钟内扩充底层资源,满足快速部署数千个应用实例的需求。阿里云容器服务团队的建议下,洋葱学院还进一步优化了整体的ECS服务器配置,将大量的小规格ECS服务器更换成30至50核大规格ECS,从容应对10倍扩容,同时运维管控更加便捷。

针对疫情延期开学,洋葱学院作为头部K12在线教育公司,免费向全国师生开放了平台的全部核心课程资源,这期间每天的学习访问人数持续飙升。使用云容器之后,系统在资源利用率上提升了约60%,出现问题后可快速隔离,当面对急剧增长的业务量,也可以在短时间内扩容进行业务支撑。 ——李诺 洋葱学院联合创始人&CTO

TB1dI1HfHH1gK0jSZFwXXc7aXXa_1530_1140_1_

数据库的升级

为了确保平台使用起来“丝般顺滑”,阿里云为洋葱学院提供了综合架构解决方案:数据库层将云数据库Redis数据库做高速缓存,RDS PostgreSQL+MongoDB做持久化存储;应用层对微服务进行改造,以及容器化部署。这是完成挑战的核心能力。

洋葱学院还对冷用户和冷热数据做了优化:冷用户,即第一次来的用户信息较少,此期间冷用户过多,亟需优化冷用户的流程处理,这需要提高高压下的数据快速处理能力,处理变得更快;老师和学生的作业数据,会有冷热数据之分,每隔一段时间进行数据迁移,但是热数据增长过快,此前方案逐渐应接不暇。在阿里云云数据专家的建议下,将冷用户缓存增加,升级数据库,对数据库进行了分库分表,还进行了一系列索引优化、语句改写以及业务改造等工作。

在此次疫情中,洋葱学院利用阿里云数据库的极致弹性、无缝升级扩容能力,一晚上便完成了几十个核心数据库的容量升级以及PG实例版本升级。单个云Redis集群可承载千万级访问的超高性能,确保了即使流量数十倍增长也不会有业务瓶颈。同时,持久化存储RDS PostgreSQL、MongoDB有更强的承载能力,不仅可以应对复杂查询,还可做到极致超强弹性水平扩展,全面保障了洋葱学院的运行,在业务量比历史同期翻了10倍的情况下仍然保持平稳。

故障检测

此外,原本只能依靠负载均衡的定时扫描错误节点,故障检测存在一定时延;而Kubernetes自带容灾和错误发现机制,容器内部pod之间自动实现切换,大大缩短问题发现时间,同时基于阿里云云监控、ARMS Prometheus、ARMS前端监控和日志服务,实现云资源、容器集群、容器节点、Pod等指标的完善监控,对集群变更状态、pod创建拉起删除、组件异常等信息,基本可以覆盖到各种监控报警问题,将重大故障‘扼杀于摇篮之中’。

AI辅助教学,学生老师个性化“Friday”

_2

看过复仇者联盟的朋友们,都记得钢铁侠的AI助手Friday,每次关键时刻都协助钢铁侠力挽狂澜。

洋葱学院的APP,其实早已经成为很多学生和老师的AI助手Friday。2017年,洋葱学院成立人工智能实验室,并尝试将AI赋能引入其教学体系。最主要的原因,是希望为学生们打造完整的学习闭环,产品能根据学生的学习现状和效果,动态规划学习路径,推送个性化学习内容。

而老师则可以通过数据后台实时充分掌握班上每名学生的学习能力和知识掌握情况,为同班同学一键布置不同的教学任务。

用心做产品,以诚待客

_jpeg

洋葱学院自成立之处,便决心搭建于云上。在他们看来,自己研究开源方案或重新搭建系统,是"事倍功半"的,意味着巨大的运维负担;因此,每当有新的业务需求时,洋葱学院都会首先考虑能否使用云上已有方案,他们相信阿里云服务的稳定性、专业性。

洋葱学院将更多的人力和精力投入到了课程研发之中,打磨课程。如今,洋葱的用户遍布全国,深受师生和家长的喜爱,多达3600万学生自发推荐,社科院白皮书显示其教师推荐度和家长满意度分别高达85%和90%。

洋葱学院以匠人之心打造“ 云 ”课堂,是一群践行教育初心的梦想家和冒险家。

相关实践学习
巧用云服务器ECS制作节日贺卡
本场景带您体验如何在一台CentOS 7操作系统的ECS实例上,通过搭建web服务器,上传源码到web容器,制作节日贺卡网页。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
目录
相关文章
|
机器学习/深度学习 人工智能 数据库
飞天技术观|大模型时代,从软件工程到打通行业智能的“最后一公里”
与以往基于白盒化的软件工程范式相比,大模型能够成为新范式,提供真正的智能化引擎,从而使业务应用更高效和智能性。在这种模式下,阿里云将自身定位成大模型时代的算力服务提供者,希望能够为千行百业打通业务智能化的“最后一公里”。
741 2
|
7月前
|
运维 监控 安全
我的蚂蚁网商三年:如何系统性解决复杂问题的思考和实践
怎么样系统性解决问题?工作中一直在思考和实践,现在将最新学到的知识和实践,系统性的整理并分享出来。
|
7月前
|
人工智能 算法 安全
产业数智化没有捷径,江苏鲲鹏·昇腾生态创新中心“造了一片林”
在当地通过联合创新的方式,不断培育合作伙伴、孵化解决方案,为区域创新提供源源不断的内生力量。
|
设计模式 uml
【机房合作】机房收费系统合作版总结
【机房合作】机房收费系统合作版总结
75 0
|
存储 人工智能 运维
复旦-阿里电子信息专业学位研究生专业实践基地合作对接会成功举行
2022年6月17日,复旦-阿里电子信息专业学位研究生专业实践基地第一次合作对接会通过钉钉会议在线举行。此前,复旦大学与阿里集团针对计算机领域的电子信息专业学位研究生专业实践基地签署了共建协议,同时聘请了29位阿里技术专家担任复旦大学专业学位研究生行业导师。此次会议为双方共建专业学位研究生专业实践基地的协议签署后的首次对接活动,其主要目的是通过学院研究生导师与企业研究生行业导师的直接交流探索研究生实践化培养的具体技术领域。
807 1
复旦-阿里电子信息专业学位研究生专业实践基地合作对接会成功举行
|
云安全 新零售 运维
“安全感”要看得见,阿里云安全产品沙龙落地上海
WAF、云防火墙、云安全中心, 号称云安全入门三剑客, 出道近20年想必云安全圈子都不陌生。
192 0
“安全感”要看得见,阿里云安全产品沙龙落地上海
|
弹性计算 人工智能 运维
全面上云这条路,洋葱学院已经走了近7年
上云先锋洋葱学院这一路走来,也是和阿里云一同携手成长的难忘历程。
568 0
全面上云这条路,洋葱学院已经走了近7年
|
弹性计算 人工智能 运维
全面上云这条路,洋葱学院已经走了近7年
洋葱学院需要确保业务稳定性,采用阿里云容器服务与云数据库融合解决方案,在应用不变的情况下,快速平稳实现扩容的问题!
823 0
全面上云这条路,洋葱学院已经走了近7年
|
运维 监控 安全
是时候考虑怎么用好云了——第二期阿里云企业云上治理沙龙举行
### 前言 随着云计算的普及,越来越多的企业选择将IT基础设施搬到云上,关注的焦点也从几年前的“是否要上云”转变成了“如何用好云”。云计算极大的提升了企业的效率,举个例子,对于一家企业原来准备一个大促活动,IT团队可能需要提前几个月甚至半年来准备服务器,现在在云上只需要几个小时甚至几分钟就能完成,而且大促结束后就能立马释放掉。在效率提升的同时也极大的降低使用成本,这都是传统模式所不
608 0
是时候考虑怎么用好云了——第二期阿里云企业云上治理沙龙举行
|
弹性计算 Serverless 容器
阿里云总监课第四期:软硬件全栈专家褚霸携专家团独家分享弹性计算最佳实践
对于很多公共云用户来说,弹性计算是上云第一站。课程由弹性计算一线专家团队倾力打造,以理论讲解和实际操作结合的方式,从省钱窍门、使用误区等角度切入,覆盖背后的技术原理和架构方案,在带您找到弹性计算最佳打开方式的同时,让您建立起完善的知识体系。
2281 0