云如何支持在线学习平台并为其增加价值
高峰流量增长了十倍多。任何在线教育公司都面临着巨大的风险,因为这样的流量激增。为了继续下去,在线教育机构必须确保在面临此类挑战时拥有足够数量的员工,包括教师和助教,日常管理人员和运维技术工程师。为提供更多背景,元福道调动了356名领导教授、412名助教、151名专业工程师等相关人员,在新冠肺炎疫情期间持续提供免费直播课程,为中小学生提供高质量的教材。然而,这些人力资源也不足。
87cloud根据实际阿里云国际应用在阿里云国际上的案例综合分析在线教育解决方案的可行性。
在线教育与传统线下教育的最大区别在于在线的本质。在线教育通过互联网、智能设备和向学生广播的数字课程提供教育服务。因此,确保作为这些电子学习服务骨干的在线服务持续稳定地运行,并且没有滞后、高延迟、断开连接或停机,这一点非常重要。
话虽如此,依赖传统的数据中心和IT架构是不明智的。第一个原因是,购买、部署和使用传统本地数据中心的设备需要长达三到六个月的时间。这样的时间使得企业很难以可靠和可持续的方式应对突发的流量高峰。其次,COVID-19爆发产生的交通高峰只是暂时的。因此,在疫情结束后,购买大量物理服务器和带宽会产生相当大的浪费。第三,开发和运维的人力和时间成本将不必要地高,因为需要多个技术堆栈来应对传统数据中心的流量峰值。特别是,用于分布式存储、分布式计算、视频编解码、视频加密、CDN
分发的技术栈都是必需的。
只有采用云服务才能以具有成本效益的方式应对这些挑战。我们来描述一下某在线教育企业在COVID-19爆发期间的经历为例。该企业将其系统扩展了三倍,并在不到一周的时间内将其云资源的消耗几乎翻了一番。但是,最近一次,清点资源、交付需求和纵向扩展系统只花了不到 10 个小时。扩大规模的工作在仅有的一个上午完成,使数百万中小学生能够在同一天参加在线课程。
但现实情况是,云计算提供的远不止我们刚刚描述的在线教育。它可以提供一些可以为在线教育服务增加价值的东西。
以下是云计算服务能够为中国在线教育市场带来的一些优势。
1.从零开始快速启动:在湖北省黄冈市,通过在线直播平台为黄冈高中高年级学生(12年级学生)实施了在线教学平台,仅用了一天时间。作为技术基础,阿里云提供的ApsaraVideo
服务通过自动扩展资源、处理海量数据、智能应用数据以及在直播、视频点播等垂直视频场景中部署云产品等提供了帮助。这全面保证了系统在高并发场景下能够平稳运行。
2.深度渗透,覆盖面广:由于师生生活遍及全国各地,打造更大的非本地化在线平台,只有大量的跨城市、跨省、跨国连接才能满足位于偏远或农村地区的学生的需求。在阿里云,边缘节点是基于提供商的边缘节点和网络构建的。这确保了实时直播和交互式网络的高稳定性。此外,凭借我们的全球覆盖和多层渗透功能,边缘节点可实现在线教育服务的深度渗透和广泛覆盖。
3.按需使用:阿里云的自动扩展功能可以应对高峰流量,而传统的虚拟化技术通常会导致高峰时间以外的资源严重浪费。随着云原生技术的普及,容器已成为弹性扩展的新选择。基于 DevOps 系统,容器可以弹性地向上和向下扩展。此外,新兴的无服务器方法不仅确保了应用程序在流量高峰和骤降期间的高可用性,而且还减少了低流量期间的空闲计算资源。
4. AI +教育:AI技术将彻底改变在线教育行业,特别是在效率方面。数百万人参加在线模拟考试后,AI可以实现自动校正、智能评估、全国排名。在在线课堂中,AI可以提供智能客服,自动将在线课程转换为音频文件供学生在事后复习,并自动分析师生的视频和音频文件,根据其内容评估课堂质量。正如VIPKid首席技术官郑子斌在2019年Apsara大会上指出的那样,在云和AI技术的帮助下,在线教育正在进入以个性化教学为重点的AI时代。
5.安全性和法律合规性:由于在线的本质,在线服务存在一些安全挑战和合规风险。事实上,近几个月来,对在线教育平台的网络攻击急剧增加。在线教育和电子学习需要完整的安全防护解决方案,以防止网络攻击和其他安全威胁导致的服务中断。阿里云以技术、产品、解决方案、经验、团队和方法的形式提供全面的安全保证。
以下案例显示了阿里巴巴及其合作伙伴如何在全球抗击冠状病毒的斗争中发挥自己的作用。
阿里云提升了网络质量,提升了主营业务线,满足了VIPKid的核心需求。在在线教育中,交互式教学场景中需要非常高的网络质量。公司的核心业务指标,即班级完成率,受网络波动影响很大。如果由于网络质量低而导致课程结束,平台将向教师支付正常的课时费并补偿学生。因此,提高网络质量有助于VIPKid节省数亿元人民币(约合1400万美元),从而增加其利润。
阿里云优化业务架构,统一服务:阿里云通过多种PaaS产品,优化了系统架构,简化了运维管道,降低了VIPKid的运营成本。稳定性和可靠性是VIPKid的核心关注点。VIPKid一直对阿里巴巴集团的服务单元化能力印象深刻,目前正通过阿里云提供的工具和解决方案逐步实现业务单元化。
阿里云提供原子 AI 功能,加速团队创新:AI + 教育的关键是利用 AI 技术赋能教育行业。从本质上讲,人工智能用于执行和协助教育工作。这也是在线教育行业发展和探索的重要领域。阿里云通过提供相应的原子 AI 功能赋能 VIPKid,让 VIPKid 能够更加专注于基于 AI 场景的业务创新,并保持其行业领先地位。
充分利用容器化技术
随着实体学校的关闭,学生可能仍然会遵循他们的常规程序,并在同一时间上网。这意味着像洋葱学院这样的在线学习平台需要为巨大的流量和高度并发的访问做好准备。为了准备他们的系统,Onion Academy集成了适用于Kubernetes的阿里云容器服务和多个云数据库引擎。这使得洋葱学院能够快速,顺利地扩展业务,而无需更改应用程序本身。阿里云容器服务可以在几分钟内弹性、智能地扩展底层资源,让企业快速部署数千个应用实例。
在容器服务团队的建议下,Onion Academy 进一步优化了整体 ECS 配置,将大量小型 ECS 实例替换为具有 30 到 50 个 CPU 核心的大型 ECS 实例。这允许扩展容量是其原始扩展容量的 10 倍。
升级其数据库管理系统
接下来,为了保证洋葱学院底层平台的整体稳定性和“流畅性”,阿里云为洋葱学院提供了全面的架构解决方案。在数据库层,云数据库 Redis 版
提供高速缓存,而云数据库 RDS for PostgreSQL
和云数据库 MongoDB
版的组合则提供持久存储。在应用层,团队采用了修改后的微服务和容器化部署。这种架构为Onion Academy提供了所需的核心功能,使他们能够应对更多学生和教师登录时面临的新挑战。
洋葱学院还优化了与冷用户及其冷热数据系统连接的数据。面对过多的冷用户,公司迫切需要改进冷用户处理。这需要在高压下进行更快的数据处理。教师和学生的家庭作业数据可分为热数据和冷数据。数据最初是定期迁移的,但热数据增长太快,原始解决方案无法应对。在阿里云数据专家的建议下,洋葱学院增加了一个冷用户缓存,对数据库进行了升级和分片,并进行了一系列的索引优化和语句修改。
接下来,面对疫情,洋葱学院一夜之间升级了数十个核心数据库的容量,升级到PG级实例。这是由于阿里云数据库管理系统的极致弹性和无缝升级和扩展功能。单个云数据库 Redis 版集群能够以超高性能处理数千万个访问请求。这可确保即使流量数十倍,也不会发生业务瓶颈。同时,云数据库RDS for PostgreSQL和云数据库MongoDB提供的持久存储提供了更强大的处理能力。此解决方案可以处理复杂的查询,还允许极其弹性的水平扩展。这为洋葱学院的业务运营提供了全面的保证,并确保了业务稳定,即使其业务量增加了1000倍。
暂停课程而不停止学习:阿里云 X-Dragon + 容器解决方案
阿里云提供的 X-Dragon+ 容器解决方案非常适合此类场景。该解决方案受到在线教育企业的高度评价,并已被多家企业用于其远程学习和远程协作平台。该解决方案不仅提高了系统的整体可用性和可靠性,而且大大简化了业务应用程序的开发和迭代过程。您可以代替复杂的IT系统支持工作,而是执行在线业务和用户支持。这提供了适合当前情况的轻量级解决方案。
解决方案的主要特点
该解决方案具有五大优势:
1) 终极性能和更高的利用率
阿里云 Kubernetes 容器服务 (ACK) 可以直接在阿里云 EMB 实例上运行,CPU 或内存虚拟化性能损失为零。凭借X-Dragon架构的优势,整体性能优于具有相同配置的物理机。在各种容器化场景中,您可以使用 Kubernetes 的容器调度功能进行混合应用程序部署。这样可以提高资源利用率300%以上,充分利用EBM实例的优越性能,提高性价比。
2)快速创建和简化运维
与可在数小时内交付的传统物理机相比,EBM 实例可在几分钟内创建和启动。他们可以利用 Kubernetes 的调度和编排能力,通过 ACK 与阿里云基础设施(如 SLB、VPC、NAS、SLS)之间的紧密协调,可以快速部署服务。这大大简化了流程,降低了运维成本,提高了在线教育业务架构的自动化程度,使其能够在高峰时段提供所需的弹性。
3) 增强的网络功能和性能
与传统物理机相比,EBM 实例支持 32 个或更多 ENI。阿里云使用的 Kubernetes Terway 容器网络可以与多个 ENI 配合使用,以充分利用 EBM 实例的高带宽和高每秒数据包数 (PPS) 特性。与主机相比,容器之间的跨主机网络带宽几乎没有性能损失。此外,跨主机网络在高峰时段支持高流量和高并发网络请求。
4) 具有应用程序级加密的物理级隔离
EBM实例具有零CPU和内存虚拟化和完全排他性,提供更高的安全性和隔离性,以确保实例的稳定性。
5) 强大的故障恢复和多区域冗余
凭借 EBM 实例的自动故障转移和恢复功能以及 Kubernetes 针对容器的故障恢复漂移,该解决方案显著提高了系统的可用性和自动化运维能力。此外,基于EBM实例的多可用区部署,阿里云Kubernetes集群网络通过基于物理机的跨区域冗余提供应用容灾能力。这确保了在线教育服务的可用性。