阿里云丁玉杰:构建全场景服务引擎

简介: 2023全球边缘计算大会·上海站,阿里云边缘云演讲分享

近日,第八届全球边缘计算大会在上海成功举办。会上,阿里云高级技术专家丁玉杰,分享了阿里云边缘云多场景一站式加速解决方案,以及在边缘加速、边缘FaaS、边缘安全领域的前沿技术和实践应用。




一、全场景需求


在传统云计算场景下,企业通常都需要云的几大件——存储,计算,网络,安全等,往往需采购很多基础服务或产品,并进行整合。在这种情况下,企业的需求是全场景化的


第一,企业存在很多复合型业务,例如,在A厂商购买安全,在B厂商购买加速,如何把这两个产品或场景很容易地搭建组合起来,是一个巨大的挑战,因为不同厂家之间,产品化的开通、API的交互,其实存在很大差异。这增大了产品管理或者多云管理的成本和难度。


第二,在产品功能之外,很多企业还要求低延时和防攻击能力,同时,对于算力,也可能存在更细粒度的类似FaaS的场景需求。


以赛事或票务场景为例,由于赛事是实时的,一些数据也是实时产生的,对于时效性和安全都有很高的需求。这些场景动态性强,往往需要多个服务之间的快速组合和构建。



基于全场景需求,阿里云边缘云从基础化的产品服务,逐渐演化为基于多场景的一站式服务能力


在基础加速和安全加速基础之上,阿里云扩展出很多关于非加速场景的能力,如安全和计算。比如,在基础场景下,阿里云在CDN的边缘节点,构建了可编程CDN, 让节点具备计算的能力。此外,加速场景也衍生出了安全能力,包括基层的安全,四层的安全,机器的流量管理等。


在全站加速场景下,CDN从只做静态内容的分发,到针对需要回源、全透传的场景,阿里云边缘云也进行了能力的建设和提升,朝着全栈式的方向演进升级。




二、核心能力构建


针对加速、计算和安全领域,丁玉杰分别介绍了阿里云边缘云核心能力的构建,即运力、算力和防力。


1.运力


在加速场景,CDN拥有海量的边缘节点,而源站一般是偏集中化的。如果要把一个用户的访问,送到源站上,其核心的技术手段或方案,其实就两类,如同在高速开车一样,首先,是要构建一条高速公路;其次,是跑在公路上的车的性能要足够好。这相当于在链路和传输这两方面去进行工作。


在路径或者选路方面,阿里云边缘云关注三个维度:第一,需要找到整个网络中的最优链路;第二,找到链路之后,如何进行链路的流量管理;第三,实施策略之后,需要得到实际效果的反馈,进行策略的迭代。


在传输方面,对于边缘侧、边缘的核心骨干网、骨干网到源站,这三个维度的网络的传输优化手段存在差异性。



关于路径规划,可以直观认为,链路在运输数据时存在很多限制,例如成本、延时等。同时,边缘是数据或流量高度复用的场景,安全场景、点播直播场景、动态业务场景,这么多混合业务一起使用基础的数据情况下,如何保证资源之间不打架,如何最大化利用资源,就需要去计算各种限制情况下的最优解,这可能是全局的性能最优,或是成本最优,或是性价比的均衡等。


此外,还需考虑海量业务下计算的效率。随着业务规模的高速增长,产生的海量的端、节点、以及客户,能否保证服务工作的持续运行,保证策略实现的秒级或者分钟级的效果。阿里云对此进行了一些状态压缩以及聚类方面的操作,让业务增长和计算消耗保持非常平滑的变化。



关于传输,传输包括接入段、中间段和回源段网络,不同链路的优化手段不同,对于边缘来说,则需重点关注弱网环境。弱网环境下,常规的TCP的叠加优化或QUIC的方式,是通用的解决方案,无法很好满足细分场景需求。


阿里云边缘云,针对低延时,下载成功率,不同网络特征等,进行协议上的算法优化,以及QUIC协议的支持,从而实现不同场景需求。


在核心网方面,阿里云边缘云在三层的基础设施之上,构建了四层或者更上层的传输协议,实现性能优化手段在应用层的更可控,更高效



2.算力


在计算场景下,阿里云边缘云在FaaS方向进行了一些技术迭代,目前已在众多客户中大规模使用。不同于以往FaaS更多基于中心云的视角,阿里云边缘FaaS结合边缘优势,让计算在离用户更近的位置上发生,从而极大降低整体的延时。



以边缘FaaS在冬奥会场景中的应用为例,由于奖牌榜是实时的,页面上包括一些静态内容,同时也有关于奖牌排名和数量的动态变化。组委会基于阿里云边缘FaaS,在页面模板之上,配合算法逻辑,很轻量级地在边缘实现了动静混合页面的动态生成,而不需要在中心生成并访问拉取。



3.防力


关于安全,一般的攻击较多发生在偏动态类的场景,与静态内容放置在边缘节点不同,动态场景如游戏互动、交易、电商等场景,流量都需要回源。在不做任何安全防护的情况下,加速会放大对于远程的攻击,管道在加速传输的同时,也在加速对用户的攻击,经过网络拓展到源站,因此,需要在边缘集成安全能力,阻挡攻击的透传。



在边缘集成安全能力,相比在中心集成,有一个很大的优势。一般边缘调度都是就近的,面向中心式源站的攻击,会全球集中在一个点,从而面临全球的压力,而在边缘节点构建安全,即可把流量牵引限制在局部,只有部分流量或较小的区域受到影响。


此外,攻击容易产生大量带宽,如果攻击发生在边缘,由于边缘的资源高度复用,单位带宽成本很低,由攻击而产生的带宽成本相比中心云,就会大大降低。


目前,阿里云边缘云的安全能力可以达到Tb级,特别是DDos防护能力,而CC的处置,可以实现秒级的自动处理。




三、能力的量化


目前,依托强大技术实力,阿里云边缘云打造了包含加速、计算、安全的超大规模平台服务,拥有3200+节点数量,覆盖100+国家和地区,每日峰值带宽达到180T,此外还包括100w+域名数量,15w+ LDNS IP,以及800+ ISP。


在调度感知与逃逸方面,面向边缘海量节点,单个节点容易出现异常和故障。对于此,阿里云边缘云可以将跑超控制在0.5%的水平,同时,当单个节点出现问题导致节点服务不能满足要求时,会在5s内完成感知和逃逸。此外,在调度时,针对不同区域、不同水位情况,阿里云边缘云将策略误差可以控制在5%内。


在QUIC和协议优化方面,由于不同业务的关注指标不同,阿里云边缘云针对不同场景,进行协议栈和QUIC的差异化算法优化,实现了不同业务场景下效果的普遍提升,帮助企业提升业务价值。


短视频业务中,下载速度提高20%,相对卡顿率下降10%;

• 在下载业务中,程序下载耗时下降25%,整体业务下载耗时下降40%;

• 在图片业务中,下耗时下降14%,首屏渲染完成时间下降6%。


针对全球回源场景,阿里云边缘云可以实现分钟粒度下的实时路径规划,承载千万级QPS和十万级域名。经过动态加速后,相比BGP直接访问源站,下载平均耗时下降80ms左右,小于30ms的最极致性能区间,从6%上升至39%,大大优化了企业的延时体验。



未来,阿里云边缘云希望与更多行业合作伙伴一起,通过产品、技术、资源的深度融合,提供丰富的边缘能力,支撑边缘应用场景,助力企业持续创造价值。


目录
相关文章
|
1天前
|
存储 人工智能 运维
首批 I 阿里云通过算力服务成熟度增强级评估
近日,阿里云作为算力服务标准主要参编单位之一,参与了首批标准符合性验证,以阿里云飞天企业版为主要参评产品,完成了通用计算、智能计算和高性能计算三类计算服务能力的符合性评估。
|
2天前
|
弹性计算 Java 关系型数据库
最佳实践:阿里云倚天ECS在千寻位置时空智能服务的规模化应用
当前,千寻已有上千台倚天ECS实例在支撑线上核心业务。
|
2天前
|
弹性计算 运维 Java
最佳实践:阿里云倚天ECS在千寻位置时空智能服务的规模化应用
阿里云、平头哥及安谋科技联合举办的飞天技术沙龙探讨了倚天Arm架构在业务创新中的应用。活动中,千寻位置运维专家分享了将核心业务迁移到倚天处理器ECS实例的成功案例,强调了倚天处理器的高能效比和降本增效优势。迁移过程涉及操作系统、CICD系统和监控系统的适配,以及业务系统的性能测试。目前,千寻已迁移了上千台ECS实例到倚天处理器,实现了成本和效率的显著提升。未来计划继续扩展倚天处理器在核心业务和K8S中的应用。
|
2天前
|
弹性计算 运维 负载均衡
【阿里云弹性计算】阿里云ECS在金融科技中的应用案例:高性能交易系统的构建
【5月更文挑战第27天】阿里云ECS助力某证券公司构建高性能交易系统,满足高并发、高可用和弹性扩展需求。ECS凭借最新处理器技术、高速内存实现高性能计算;支持多地域、多可用区部署保证高可用性;弹性伸缩特性适应业务波动,降低运维成本。通过分布式架构和负载均衡技术,实现交易请求高效处理,确保系统稳定运行。案例证明,阿里云ECS是金融科技领域构建高性能交易系统的理想选择。
22 1
|
2天前
|
Cloud Native 安全 Serverless
【阿里云云原生专栏】低代码开发在云原生平台的应用:阿里云低代码服务探索
【5月更文挑战第27天】在云原生时代,低代码开发凭借其图形化界面和预构建模块,简化了应用开发,提升了效率。阿里云积极探索低代码领域,推出函数计算FC和应用配置中心ACM等服务。FC让开发者无需关注基础设施,仅需少量代码即可实现应用部署,而ACM则提供动态配置管理,增强应用灵活性。阿里云的这些服务为企业数字化转型提供了高效、安全的解决方案,预示着低代码开发在云原生平台上的重要地位。
161 1
|
2天前
|
SQL 监控 安全
【阿里云云原生专栏】云原生安全体系构建:阿里云云防火墙与WAF的应用
【5月更文挑战第27天】阿里云云防火墙和WAF是构建云原生安全体系的关键产品,提供网络、主机和Web应用多维度防护。云防火墙采用分布式架构抵御网络攻击,确保应用安全稳定;WAF专注Web应用安全,防止SQL注入、XSS和DDoS等威胁。简单部署配置,结合使用可实现全面安全防护,提升企业云上应用安全性,保障业务安全运行。未来,阿里云将持续强化云原生安全建设。
105 1
|
3天前
|
弹性计算 缓存 安全
【阿里云弹性计算】阿里云ECS与CDN结合:构建高性能全球内容分发网络
【5月更文挑战第26天】阿里云ECS与CDN结合打造高性能全球内容分发网络,通过ECS的弹性伸缩和安全可靠性,配合CDN的全球覆盖、高可用性及安全防护,提升访问速度,减轻服务器压力,优化数据传输。以WordPress为例,通过配置CDN域名和ECS,实现高效内容分发,提高系统扩展性和稳定性。此解决方案满足用户对访问速度和稳定性的高要求,为企业提供优质的云计算体验。
29 0
|
5天前
|
Cloud Native NoSQL 关系型数据库
动态精选|阿里云4月产品与服务更新盘点
动态精选|阿里云4月产品与服务更新盘点
39 1
|
5天前
|
存储 机器学习/深度学习 弹性计算
【阿里云弹性计算】阿里云ECS实例选择指南:理解不同实例系列的适用场景
【5月更文挑战第24天】阿里云ECS实例系列包括计算优化型、内存优化型、存储优化型、GPU加速型和通用型,适用于不同场景。计算优化型适合计算密集型任务,内存优化型适用于内存数据库,存储优化型针对高I/O需求,GPU加速型用于图形处理和深度学习,通用型则平衡各类需求。选择时需考虑应用类型、性能需求、成本效益和可扩展性。提供的示例代码展示了如何使用阿里云CLI创建通用型实例。本文旨在帮助用户根据业务需求选择最适合的ECS实例。
30 1
|
5天前
|
人工智能 弹性计算 监控
【阿里云云原生专栏】阿里云云原生与AI结合:智能应用的快速构建与部署
【5月更文挑战第24天】阿里云融合云原生和AI技术,助力快速构建智能应用。弹性伸缩、CI/CD、微服务和自动化运维带来优势。通过需求分析、环境准备、数据处理、模型开发到服务部署,阿里云提供容器服务、函数计算、服务网格等工具,支持自动化测试和监控,实现一站式智能应用开发。示例代码展示创建ACK集群和部署AI模型服务过程。
277 1

热门文章

最新文章