阿里云弹性计算首席架构师分享云上应用架构演进三大方向

简介: 从基础设施和应用层出发,依托云计算构建更可靠、更敏捷和更智能的IT架构,将为企业释放巨大技术红利。

封面-蔡俊杰.jpg

12月10日,在2021云上架构与运维峰会上,阿里云智能弹性计算首席架构师蔡俊杰发表了主题为“可靠、敏捷、智能——云上应用架构演进”的演讲,分享其在“云上架构”方向丰富的行业经验。以下为他的演讲精华:


 

一、直面机遇与挑战,技术驱动业务创新


时代发展到今天,各行各业的企业均面临着不同的机遇和挑战。

幻灯片3.JPG


首先的关注点就是社会的生活方式与生产方式的全面的数字化,无论是传统企业还是互联网企业,他们的生产系统、办公系统、商业销售、客户交互,都会不可逆转地全面线上化,比如今的外卖平台或者出行交通系统,都可以用手机操作来达成线上交易。


其次企业所面临的外部环境变化极快。比如消费者的喜好和需求,随着消费层级及大环境在不断变化,进而很多零售企业也需要不断地加快产品上线,提高产品的核心竞争力,To C的互联网企业也如此。10月的云栖大会上,阿里云的客户映客分享,其新应用上线的频率高达1次/周。


即便不考虑消费者,竞争对手也在不断地互相拼速度。当下现状还伴随着不可控的疫情影响,以及监管政策、地缘政治等时刻影响着行业环境。


人工智能、5G、大数据等新技术、同样也给了企业更多的能力和工具创新、实现自我变革和发展。


企业全面数字化,意味着企业的关键业务乃至“身家性命”都已经全部放在IT系统之上,因此企业需要系统足够稳定可靠,变化迅速的市场和激烈的竞争环境,也需要更敏捷的研发效率和应用架构来支持业务创新,从而在市场上赢得先机。更需要利用好AI、大数据等新技术,优化业务管理和运营,实现智能化的业务升级。


以上,都需要一个优秀的IT架构来支撑一个优秀的架构应该具备三个方面的特征:可靠、敏捷和智能

幻灯片4.JPG


 

云如何帮助企业构建优秀的IT架构?


每个架构模式都有其适合的场景,企业所处阶段的不同、人力资源的多寡、开发人员的技能高低等,都会影响架构的选择。没有最好的架构,只有最适合的架构。并且架构需要持续演进,才能够支持业务发展。

image.gif

幻灯片5.JPG

不管是从业务需求场景还是技术趋势来说,架构的发展要求整体来讲都是要更可靠、更敏捷、更智能


越来越多的企业,重视高可用架构的构建,使用双活、多可用区、多地域、混沌工程等丰富的手段来提升应用的可靠性。微服务、Serverless也是近年来非常的热门话题。以上均是相较之前更为敏捷的IT架构,某种程度上,也可以称作其是更可靠的架构。同时移动互联网、物联网的到来也让数据大爆发,大数据和AI等大计算需求场景也在日益增加。


那么云计算如何能帮助客户构建一个可靠、敏捷和智能的架构呢?


01 可靠

在可靠的层面,可以分为两部分:基础设施层的可靠以及应用层的可靠


幻灯片6.JPG

基础不牢、地动山摇,这是在架构师中流传很广的一句话。阿里云提供了非常可靠的基础资源,是全球第一个提供单实例可用性SLA 99.975%、多可用区多实例可用性99.995%的云厂商。以上都得益于阿里云自主研发的飞天底座,其中有大量的技术创新,比如准确率达到70%以上的智能故障预测、95%以上客户无感的热迁移技术等。


阿里云自研的神龙架构,也让整个系统的性能十分线性和平稳,客户也能够在使用阿里云产品的同时体验到了可预期的高性能。


当然,单实例和单可用区的可用性只能保证当前地域的高可靠,但不能抵抗极端天气,工地施工导致光纤被挖断等导致的地域性故障。因此,客户还需要做好应用层的高可用,使用多可用区、多地域部署等容灾方案。


我们建议使用成熟的托管型产品代替自建,比如数据库和中间件类产品,阿里云在这些产品上投入巨大,通常要比自建更加可靠和方便。最终高可用的应用必定是一个面面俱到的架构设计,是高可靠的基础资源,加上高稳定的托管产品,再加上应用本身的高可用设计组合而成的

image.gif幻灯片7.JPG


基础设施除了做到自身高可靠,还需要透明开放。很多客户上云之后,觉得基础设施层变成了一个黑盒,因此要求提供方能清晰地告诉他们底层的基础设施在发生什么,以便他们能做更好的主动运维。


其实这个需求非常合理,因此,ECS会把这些信息尽可能多地开放给用户,封装成不同的接口和事件,提供给用户,比如用户可以随时获取云服务器、操作系统等基础设施的最新情况。系统预测到客户方的机器可能会宕机、检测到CPU和内存用到警戒线了,都会发送事件,客户可以选择订阅。


有用户反馈,最吸引他能长期使用阿里云产品的一点就是,阿里云有非常丰富和全面的接口。阿里云的接口,迄今为止是国内最全面、最丰富、最细致的,甚至在全球范围内,也是毫不逊色的。


02 敏捷

这个世界变化太快,怎么办?所谓天下武功,唯快不破!面对变化,唯一的办法就是比变化更快


这就需要一个极度敏捷的架构。同样,企业需要在两个层面上实现敏捷:应用层的敏捷和基础设施层的敏捷

幻灯片8.JPG


企业都在构建敏捷灵活的组织架构和软件架构,这里面的其中一个核心思想是让研发团队之间的依赖更少、更容易地独立迭代演进,于是企业都开始采用微服务架构,也是符合云原生趋势的应用架构。


其实应用架构的敏捷也是依托于基础设施的敏捷。越是敏捷的架构,越能快速响应不寻常的业务峰值,处理过程也就越平滑,不仅能够降低成本,客户体验也是最好的。比如12306、比如微博热点,这种瞬时级别的流量,在线下的数据中心里,即便上层架构再敏捷,也很难在短时间交付和部署如此大的计算量。


敏捷的基础设施,需要做到两点:敏捷交付和高效管理

幻灯片9.JPG


阿里云作为领先的基础设施,首先要做到的就是快速交付


阿里云弹性计算提供了多种开箱即用的基础资源,仅云服务器就有上百款规格,并且提供极致的弹性能力。今年7月,阿里云作为首个也是唯一一个通过信通院大规模云平台性能测试的云厂商,在信通院工作人员的见证下,18分钟扩容了1万台云服务器,而这还不是阿里云最快的速度。


2021年10月的云栖大会上,阿里云弹性容器实例ECI的研发同学,现场演示了在6秒内扩容了3000个POD。借助阿里云弹性计算强大的弹性伸缩能力,客户可以快速地交付和部署底层资源,轻松应对流量峰值或者扩容新业务。


针对不同的资源交付方式,阿里云还提供了丰富的付费模式,客户可以兼顾灵活与实惠

幻灯片10.JPG


要真正实现敏捷,客户在管理和使用计算资源的时候,还需要做到非常高效,这就需要各种自动化能力支持。从迁移、部署、运维到容量管理,阿里云提供了一整套覆盖资源全生命周期的自动化运维工具。


比如,利用阿里云的资源编排服务ROS,可以自动化部署几千几万台云服务器。疫情期间,钉钉就使用ROS在短短2小时内新增部署了超过1万台云服务器,平稳渡过流量洪峰。


03 智能

全方位的智能包括业务应用层的智能和基础设施层的智能。

幻灯片11.JPG


在业务层,企业需要根据自己的业务,引入相对应的机器学习、大数据等相关的技术,实现智能客服、自动驾驶等能力,这些都需要大量的数据和算力作为基础。为此,阿里云弹性计算针对这些场景提供了量身定做的大数据和本地盘实例,以及GPU和NPU等实例,为上层业务创新提供最适合的基础设施。


PaaS层面,阿里云提供了丰富的人工智能服务、机器学习和大数据框架等,客户可以轻松构建上层的应用智能。


基础设施层,阿里云的调度系统、故障预测和运维系统等,都广泛使用人工智能技术,使阿里云成为全球领先的IaaS技术平台。同时在弹性计算服务的用户体验上,我们也利用人工智能技术为客户提供一个更为聪明的基础设施。

幻灯片12.JPG


比如智能弹性服务,以往客户可能需要根据自身的业务特点,在需要的时候提前开好机器给上层业务使用,或者使用阿里云的弹性伸缩服务设置好策略,让其定时开启。


阿里云弹性伸缩产品最新的预测模式,可以根据用户伸缩组最近1-14天的CPU使用率、内网出入流量等进行建模,通过机器学习算法预测未来2天整体的使用情况,并自动进行扩缩容操作。使用了这个功能,常规的扩缩容客户基本上不用费心。


其次是阿里云的智能诊断与自助修复工具,当阿里云用户遇到ECS相关的问题时,只能通过提交工单或者联系服务同学来解决,周期较长,一定程度上影响了用户体验。实例健康诊断工具,利用后端的NLP等AI能力,可以帮助用户快速定位ECS内外部可能存在的问题,并提供修复方案,将问题的解决周期从24小时缩短至分钟级。在云服务器领域,阿里云是第一个为用户开放此全覆盖诊断能力的云厂商


再比如阿里云的智能资源优化服务,它可以根据用户的资源使用情况,为用户识别出资源错配的情况,并根据业务负载为用户推荐适合的实例。倘若客户资源使用率长期偏低,造成了成本浪费;CPU负载持续偏高,可能会导致业务不稳定,它就会推荐您升级配置或者新增资源。

幻灯片13.JPG


整体来看,阿里云弹性计算已经不仅仅是一个提供计算资源的平台,而进化成了一个支持应用全生命周期服务的云平台。阿里云通过强劲可靠、覆盖全场景的云服务器,高效智能的自动化运维套件,还有灵活弹性的资源供给,帮助客户构建可靠、敏捷、智能的云上架构。今年,阿里云还推出了面向办公场景的无影云电脑、以及面向合作伙伴服务上云的计算巢平台

幻灯片14.JPG


把云用好来构建一个优秀的应用架构,给业务带来的价值是多方面的,包括帮助业务永续、平稳运行,降低了业务的风险;降低成本;提高效率;也正面提升了团队的人效和幸福感。


蔡俊杰也在末尾给大家分享了两个实际案例

客户案例.png


原来,申通快递使用线下机房作为计算及数据存储平台,逢双11资源需求就会膨胀,大促之后则闲置浪费。上云后,几乎全部的资源都是按量购买,稳步度过双11后即刻释放,真正做到了开箱即用,不产生一天浪费。2020年双11与2019年双11当天对比,相比此前传统IDC架构方案,使用云上的神龙裸金属服务器+容器服务方案,帮助申通快递在业务量大幅提升的情况下,IT投入反而降低了30%。


吉利汽车制造企业通过使用神龙超级计算集群 SCC 在同等硬件基础上效率提升20%,任务排队时间缩短了3倍左右,集群规模随着业务弹性伸缩,最终显著提升仿真效率近三成,缩短车型设计和推出市场时间若干个月。


 

二、从上云到用好云,把握技术红利


用好云.png


上云已经成为了业界的共识


云计算虽已发展十余年,但这仅仅还是开始。我们观察到,很多的客户还没有把云的红利与优势充分地利用起来,比如云改变得最多的运维领域,大部分客户还处于半手工半自动化的阶段。所以,现在很多企业的关注重点,已经从上云变成了用好云。我们相信,未来十年,用好云,将为企业释放巨大的技术红利


福利时间12月21日14:00-17:00,澎湃算力,无处不在——2021阿里云弹性计算年度峰会,将开启线上直播。结合企业上云大势和云计算的技术红利浪潮,本次峰会将在前沿技术、产品生态、上云实践等方面带来最新的业态解读与创新实践分享。


点击大会官网,欢迎预约,线上观看峰会直播。

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
6天前
|
缓存 NoSQL Java
秒杀圣经:10Wqps秒杀,16大架构绝招,一文帮你秒变架构师 (2)
高并发下的秒杀系统设计是一个复杂的挑战,涉及多个关键技术点。40岁老架构师尼恩在其读者交流群中分享了16个关键架构要点,帮助解决高并发下的秒杀问题,如每秒上万次下单请求的处理、超卖问题的解决等。这些要点包括业务架构设计、流量控制、异步处理、缓存策略、限流熔断、分布式锁、消息队列、数据一致性、存储架构等多个方面。尼恩还提供了详细的实战案例和代码示例,帮助读者全面理解和掌握秒杀系统的架构设计。此外,他还分享了《尼恩Java面试宝典》等资源,帮助读者在面试中脱颖而出。如果你对高并发秒杀系统感兴趣,可以关注尼恩的技术自由圈,获取更多详细资料。
秒杀圣经:10Wqps秒杀,16大架构绝招,一文帮你秒变架构师 (2)
|
1天前
|
Cloud Native Go API
Go语言在微服务架构中的创新应用与实践
本文深入探讨了Go语言在构建高效、可扩展的微服务架构中的应用。Go语言以其轻量级协程(goroutine)和强大的并发处理能力,成为微服务开发的首选语言之一。通过实际案例分析,本文展示了如何利用Go语言的特性优化微服务的设计与实现,提高系统的响应速度和稳定性。文章还讨论了Go语言在微服务生态中的角色,以及面临的挑战和未来发展趋势。
|
4天前
|
存储 监控 前端开发
掌握微前端架构:构建未来前端应用的基石
【10月更文挑战第12天】随着前端技术的发展,传统的单体应用架构已无法满足现代应用的需求。微前端架构通过将大型应用拆分为独立的小模块,提供了更高的灵活性、可维护性和快速迭代能力。本文介绍了微前端架构的概念、核心优势及实施步骤,并探讨了其在复杂应用中的应用及实战技巧。
|
2天前
|
运维 Go 开发者
Go语言在微服务架构中的应用与优势
本文深入探讨了Go语言在构建微服务架构中的独特优势和实际应用。通过分析Go语言的核心特性,如简洁的语法、高效的并发处理能力以及强大的标准库支持,我们揭示了为何Go成为开发高性能微服务的首选语言。文章还详细介绍了Go语言在微服务架构中的几个关键应用场景,包括服务间通信、容器化部署和自动化运维等,旨在为读者提供实用的技术指导和启发。
|
4天前
|
设计模式 测试技术 持续交付
架构视角下的NHibernate:设计模式与企业级应用考量
【10月更文挑战第13天】随着软件开发向更复杂、更大规模的应用转变,数据访问层的设计变得尤为重要。NHibernate作为一个成熟的对象关系映射(ORM)框架,为企业级.NET应用程序提供了强大的支持。本文旨在为有一定经验的开发者提供一个全面的指南,介绍如何在架构层面有效地使用NHibernate,并结合领域驱动设计(DDD)原则来构建既强大又易于维护的数据层。
21 2
|
5天前
|
运维 Serverless 数据处理
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
25 3
|
6天前
|
负载均衡 Go API
探索Go语言在微服务架构中的应用与优势
在这篇技术性文章中,我们将深入探讨Go语言(又称为Golang)在构建微服务架构时的独特优势。文章将通过对比分析Go语言与其他主流编程语言,展示Go在并发处理、性能优化、以及开发效率上的优势。同时,我们将通过一个实际的微服务案例,详细说明如何利用Go语言构建高效、可扩展的微服务系统。
|
5天前
|
存储 消息中间件 人工智能
ApsaraMQ Serverless 能力再升级,事件驱动架构赋能 AI 应用
本文整理自2024年云栖大会阿里云智能集团高级技术专家金吉祥的演讲《ApsaraMQ Serverless 能力再升级,事件驱动架构赋能 AI 应用》。
|
6天前
|
缓存 NoSQL Java
秒杀圣经:10Wqps高并发秒杀,16大架构杀招,帮你秒变架构师 (1)
高并发下,如何设计秒杀系统?这是一个高频面试题。40岁老架构师尼恩的读者交流群中,近期有小伙伴在面试Shopee时遇到了这个问题,未能很好地回答,导致面试失败。为此,尼恩进行了系统化、体系化的梳理,帮助大家提升“技术肌肉”,让面试官刮目相看。秒杀系统设计涉及16个架构要点,涵盖业务架构、流量架构、异步架构、分层架构、缓存架构、库存扣减、MQ异步处理、限流、熔断、降级、存储架构等多个方面。掌握这些要点,可以有效应对高并发场景下的秒杀系统设计挑战。
秒杀圣经:10Wqps高并发秒杀,16大架构杀招,帮你秒变架构师 (1)
|
2天前
|
Kubernetes 监控 持续交付
深入理解微服务架构及其在现代应用开发中的应用
【10月更文挑战第15天】深入理解微服务架构及其在现代应用开发中的应用
11 0